{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [],
   "source": [
    "from selenium import webdriver \n",
    "import  time \n",
    "import requests\n",
    "import pandas as pd"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "<ipython-input-2-89ffedf7a14e>:7: DeprecationWarning: use options instead of chrome_options\n",
      "  driver = webdriver.Chrome( chrome_options = opts)\n"
     ]
    }
   ],
   "source": [
    "opts = webdriver.ChromeOptions()\n",
    "opts.add_argument('--no-sandbox')#解决DevToolsActivePort文件不存在的报错\n",
    "opts.add_argument('window-size=1920x3000') #指定浏览器分辨率\n",
    "opts.add_argument('--disable-gpu') #谷歌文档提到需要加上一这个属性来规避bug\n",
    "opts.add_argument('--hide-scrollbars') #隐藏滚动条, 应对些特殊页面\n",
    "#opts.add_argument('blink-settings=imagesEnabled=false') #不加载图片, 提升速度\n",
    "driver = webdriver.Chrome( chrome_options = opts)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [],
   "source": [
    "driver.get('https://www.cnki.net/')\n",
    "time.sleep(0.3)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 查看是否登陆成功"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "'中山大学南方学院'"
      ]
     },
     "execution_count": 5,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "driver.find_element_by_id(\"Ecp_loginShowName1\").get_attribute('innerHTML')"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 点击高级检索（此时打开两个页面，需要切换窗口）"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [],
   "source": [
    "driver.find_element_by_xpath('//*[@id=\"highSearch\"]').click()\n",
    "time.sleep(0.3)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "['CDwindow-B1FC6712DC08D479F1F2D1484486C2B4', 'CDwindow-A0DB38434AD94E59C18B99BC4A7FF320']\n"
     ]
    }
   ],
   "source": [
    "print (driver.window_handles)\n",
    "driver.switch_to.window(driver.window_handles[-1])\n",
    "time.sleep(0.3)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 点击期刊"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 8,
   "metadata": {},
   "outputs": [],
   "source": [
    "driver.find_element_by_xpath('/html/body/div[3]/div[1]/div/ul[1]/li[1]/a').click()\n",
    "time.sleep(0.3)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 选择核心期刊，C刊进行勾选"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 9,
   "metadata": {},
   "outputs": [],
   "source": [
    "driver.find_element_by_xpath('/html/body/div[2]/div/div[2]/div/div[1]/div[1]/div[2]/div[1]/div[3]/div/label[5]/input').click()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 10,
   "metadata": {},
   "outputs": [],
   "source": [
    "driver.find_element_by_xpath('/html/body/div[2]/div/div[2]/div/div[1]/div[1]/div[2]/div[1]/div[3]/div/label[6]/input').click()\n",
    "time.sleep(0.3)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 填写检索的关键信息，进行检索"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 11,
   "metadata": {},
   "outputs": [],
   "source": [
    "driver.find_element_by_xpath('//*[@id=\"gradetxt\"]/dd[1]/div[2]/input').send_keys(\"数据挖掘\")\n",
    "time.sleep(0.3)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 12,
   "metadata": {},
   "outputs": [],
   "source": [
    "driver.find_element_by_xpath('/html/body/div[2]/div/div[2]/div/div[1]/div[1]/div[2]/div[2]/input').click()\n",
    "time.sleep(0.3)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 用selenium寻找元素（属性、selector、xpath）按照发表时间的顺序进行检索"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 13,
   "metadata": {},
   "outputs": [],
   "source": [
    "#driver.find_element_by_xpath('//*[@id=\"orderList\"]/li[2]').click()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 14,
   "metadata": {},
   "outputs": [],
   "source": [
    "#driver.find_element_by_xpath('/html/body/div[4]/div/div[2]/div/div[1]/div[1]/div[2]/div[2]/input').click()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 15,
   "metadata": {},
   "outputs": [],
   "source": [
    "driver.find_element_by_class_name('pagerTitleCell').get_attribute('innerHTML')\n",
    "time.sleep(0.3)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 16,
   "metadata": {
    "scrolled": true
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "455\n",
      "9090\n",
      "<class 'int'>\n"
     ]
    }
   ],
   "source": [
    "results = driver.find_element_by_class_name('pagerTitleCell').find_element_by_tag_name('em').text\n",
    "all_re = int(results.replace(\",\",\"\"))\n",
    "num_results = int(all_re)\n",
    "num_pages = int(num_results/20) + 1\n",
    "print(num_pages)\n",
    "print(num_results)\n",
    "print(type(num_results))"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 换条数"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 19,
   "metadata": {},
   "outputs": [],
   "source": [
    "driver.find_element_by_xpath('//*[@id=\"perPageDiv\"]/div/i').click()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 20,
   "metadata": {},
   "outputs": [],
   "source": [
    "driver.find_element_by_xpath('//*[@id=\"perPageDiv\"]/ul/li[3]/a').click()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 21,
   "metadata": {
    "scrolled": true
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Unnamed: 0</th>\n",
       "      <th>篇名</th>\n",
       "      <th>作者</th>\n",
       "      <th>刊名</th>\n",
       "      <th>发表时间</th>\n",
       "      <th>被引</th>\n",
       "      <th>下载</th>\n",
       "      <th>操作</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>1</td>\n",
       "      <td>一种基于ELM-AE特征表示的谱聚类算法  网络首发</td>\n",
       "      <td>王丽娟; 丁世飞</td>\n",
       "      <td>智能系统学报</td>\n",
       "      <td>2021-06-15 16:40</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>2</td>\n",
       "      <td>基于数据挖掘的肝癌动物模型应用分析  网络首发</td>\n",
       "      <td>雷会霞; 苗明三</td>\n",
       "      <td>中药药理与临床</td>\n",
       "      <td>2021-06-15 16:20</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>3</td>\n",
       "      <td>基于数据挖掘的反流性食管炎动物模型应用分析  网络首发</td>\n",
       "      <td>朱正望; 朱平生; 苗明三</td>\n",
       "      <td>中药药理与临床</td>\n",
       "      <td>2021-06-15 15:29</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>4</td>\n",
       "      <td>深海富钴结核微区X射线荧光光谱分析和数据挖掘</td>\n",
       "      <td>任江波;王汾连;何高文;张昕;邓希光</td>\n",
       "      <td>光谱学与光谱分析</td>\n",
       "      <td>2021-06-15</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>5</td>\n",
       "      <td>基于数据挖掘的宫颈癌动物模型应用分析  网络首发</td>\n",
       "      <td>韩艳珍; 白明; 康乐; 张瑾; 苗明三</td>\n",
       "      <td>中药药理与临床</td>\n",
       "      <td>2021-06-09 16:07</td>\n",
       "      <td>NaN</td>\n",
       "      <td>89.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5</th>\n",
       "      <td>6</td>\n",
       "      <td>基于深度学习的知识追踪研究进展  网络首发</td>\n",
       "      <td>刘铁园; 陈威; 常亮; 古天龙</td>\n",
       "      <td>计算机研究与发展</td>\n",
       "      <td>2021-06-09 15:24</td>\n",
       "      <td>NaN</td>\n",
       "      <td>247.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>6</th>\n",
       "      <td>7</td>\n",
       "      <td>基于数据挖掘的中药治疗宫颈癌用药规律分析  网络首发</td>\n",
       "      <td>兰俊;綦向军;莫嘉浩;李丹云;吴金凤</td>\n",
       "      <td>中药药理与临床</td>\n",
       "      <td>2021-06-09 15:00</td>\n",
       "      <td>NaN</td>\n",
       "      <td>172.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>7</th>\n",
       "      <td>8</td>\n",
       "      <td>脉络学说理论分析不稳定型心绞痛医案证治规律及网络药理学机制分析  网络首发</td>\n",
       "      <td>王康;李雅文;常丽萍;尹玉洁;朱垚</td>\n",
       "      <td>中国实验方剂学杂志</td>\n",
       "      <td>2021-06-09 14:28</td>\n",
       "      <td>NaN</td>\n",
       "      <td>72.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8</th>\n",
       "      <td>9</td>\n",
       "      <td>基于数据挖掘的慢性不可预知温和刺激抑郁症动物模型特点分析  网络首发</td>\n",
       "      <td>刘慧娟;康乐;留甜甜;乔靖怡;白明</td>\n",
       "      <td>中药药理与临床</td>\n",
       "      <td>2021-06-09 10:36</td>\n",
       "      <td>NaN</td>\n",
       "      <td>45.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>9</th>\n",
       "      <td>10</td>\n",
       "      <td>古代医籍中治疗筋病内服药规律的数据挖掘研究  网络首发</td>\n",
       "      <td>覃堃; 施展</td>\n",
       "      <td>中药药理与临床</td>\n",
       "      <td>2021-06-08 17:51</td>\n",
       "      <td>NaN</td>\n",
       "      <td>48.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>10</th>\n",
       "      <td>11</td>\n",
       "      <td>企业战略性知识轮廓:化工专利数据挖掘与分析  网络首发</td>\n",
       "      <td>王江; 郭鑫彬</td>\n",
       "      <td>情报杂志</td>\n",
       "      <td>2021-06-08 17:45</td>\n",
       "      <td>NaN</td>\n",
       "      <td>57.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>11</th>\n",
       "      <td>12</td>\n",
       "      <td>基于代价敏感卷积神经网络的非平衡问题混合方法  网络首发</td>\n",
       "      <td>黄颖琦; 陈红梅</td>\n",
       "      <td>计算机科学</td>\n",
       "      <td>2021-06-08 15:20</td>\n",
       "      <td>NaN</td>\n",
       "      <td>63.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>12</th>\n",
       "      <td>13</td>\n",
       "      <td>岩石地球化学数据挖掘及弱异常识别——以新疆阿舍勒铜矿为例  网络首发</td>\n",
       "      <td>郑超杰;刘攀峰;罗先熔;文美兰;黄文斌</td>\n",
       "      <td>大地构造与成矿学</td>\n",
       "      <td>2021-06-08 11:09</td>\n",
       "      <td>NaN</td>\n",
       "      <td>22.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>13</th>\n",
       "      <td>14</td>\n",
       "      <td>基于中医传承辅助平台分析中医药治疗尿源性脓毒症的证治规律</td>\n",
       "      <td>姚晓彬</td>\n",
       "      <td>中药新药与临床药理</td>\n",
       "      <td>2021-06-08</td>\n",
       "      <td>NaN</td>\n",
       "      <td>68.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>14</th>\n",
       "      <td>15</td>\n",
       "      <td>文本与数据挖掘对著作权例外体系的冲击与应对  网络首发</td>\n",
       "      <td>马治国; 赵龙</td>\n",
       "      <td>西北师大学报(社会科学版)</td>\n",
       "      <td>2021-06-07 17:24</td>\n",
       "      <td>NaN</td>\n",
       "      <td>121.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>15</th>\n",
       "      <td>16</td>\n",
       "      <td>Grover算法改进与应用综述  网络首发</td>\n",
       "      <td>刘晓楠; 宋慧超; 王洪; 江舵; 安家乐</td>\n",
       "      <td>计算机科学</td>\n",
       "      <td>2021-06-07 14:53</td>\n",
       "      <td>NaN</td>\n",
       "      <td>74.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>16</th>\n",
       "      <td>17</td>\n",
       "      <td>甘松中医药用药规律的数据挖掘</td>\n",
       "      <td>饶瑶;李冉;王晓雯;薛变霞;李世伟</td>\n",
       "      <td>中草药</td>\n",
       "      <td>2021-06-07</td>\n",
       "      <td>NaN</td>\n",
       "      <td>116.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>17</th>\n",
       "      <td>18</td>\n",
       "      <td>利用转录组数据挖掘东紫苏单萜生物合成相关基因</td>\n",
       "      <td>耿秀文; 张爱丽; 唐仁华; 普春霞</td>\n",
       "      <td>中草药</td>\n",
       "      <td>2021-06-07</td>\n",
       "      <td>NaN</td>\n",
       "      <td>67.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>18</th>\n",
       "      <td>19</td>\n",
       "      <td>论坛情感挖掘研究综述：现状、挑战与趋势  网络首发</td>\n",
       "      <td>陈迪;程朗;王志锋;熊锦鹏;张玉茹</td>\n",
       "      <td>计算机工程与应用</td>\n",
       "      <td>2021-06-03 16:00</td>\n",
       "      <td>NaN</td>\n",
       "      <td>353.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>19</th>\n",
       "      <td>20</td>\n",
       "      <td>基于CNKI文献计量分析的过程挖掘研究评述与展望</td>\n",
       "      <td>花龙雪; 吴应良</td>\n",
       "      <td>管理学报</td>\n",
       "      <td>2021-06-01</td>\n",
       "      <td>NaN</td>\n",
       "      <td>364.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>20</th>\n",
       "      <td>21</td>\n",
       "      <td>基于数据挖掘技术的钛合金铣削工艺参数优化  网络首发</td>\n",
       "      <td>刘献礼; 孙庆贞; 岳彩旭; 李恒帅</td>\n",
       "      <td>计算机集成制造系统</td>\n",
       "      <td>2021-05-31 17:09</td>\n",
       "      <td>NaN</td>\n",
       "      <td>142.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>21</th>\n",
       "      <td>22</td>\n",
       "      <td>现代名老中医医案数据库的构建与数据处理</td>\n",
       "      <td>赵泽鹏; 戴国华; 高武霖</td>\n",
       "      <td>中医杂志</td>\n",
       "      <td>2021-05-31</td>\n",
       "      <td>NaN</td>\n",
       "      <td>164.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>22</th>\n",
       "      <td>23</td>\n",
       "      <td>基于数据挖掘的冷藏陈列柜的负荷预测研究</td>\n",
       "      <td>袁培;雷正霖;曾庆辉;武宜霄;吕彦力</td>\n",
       "      <td>流体机械</td>\n",
       "      <td>2021-05-30</td>\n",
       "      <td>NaN</td>\n",
       "      <td>13.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>23</th>\n",
       "      <td>24</td>\n",
       "      <td>基于LSTM的飞行数据挖掘模型构建方法研究  网络首发</td>\n",
       "      <td>王志刚; 王业光; 杨宁; 米禹丰; 曲晓雷</td>\n",
       "      <td>航空学报</td>\n",
       "      <td>2021-05-27 13:49</td>\n",
       "      <td>NaN</td>\n",
       "      <td>112.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>24</th>\n",
       "      <td>25</td>\n",
       "      <td>轨迹数据的时空模式挖掘与管理决策研究综述  网络首发</td>\n",
       "      <td>孙爽; 陈燕; 朴在吉; 张金松</td>\n",
       "      <td>计算机工程与应用</td>\n",
       "      <td>2021-05-27 11:44</td>\n",
       "      <td>NaN</td>\n",
       "      <td>94.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>25</th>\n",
       "      <td>26</td>\n",
       "      <td>基于新闻大数据的北极地区地缘关系研究</td>\n",
       "      <td>李萌;袁文;袁武;牛方曲;李汉青</td>\n",
       "      <td>地理学报</td>\n",
       "      <td>2021-05-25</td>\n",
       "      <td>NaN</td>\n",
       "      <td>191.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>26</th>\n",
       "      <td>27</td>\n",
       "      <td>基于数据挖掘的中药治疗鼻咽癌的用药规律分析</td>\n",
       "      <td>方彩珊;綦向军;萧韵婷;莫嘉浩;廖梦颖</td>\n",
       "      <td>中药新药与临床药理</td>\n",
       "      <td>2021-05-25</td>\n",
       "      <td>NaN</td>\n",
       "      <td>241.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>27</th>\n",
       "      <td>28</td>\n",
       "      <td>基于数据挖掘方法分析曹志群治疗慢性萎缩性胃炎的用药规律</td>\n",
       "      <td>战俊邑;张新;丁楠;高慧;严如根</td>\n",
       "      <td>中药新药与临床药理</td>\n",
       "      <td>2021-05-25</td>\n",
       "      <td>NaN</td>\n",
       "      <td>166.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>28</th>\n",
       "      <td>29</td>\n",
       "      <td>基于渔船AIS数据的南海北部海洋渔业捕捞强度空间特征挖掘</td>\n",
       "      <td>李晓恩;周亮;肖杨;吴文周;苏奋振</td>\n",
       "      <td>地球信息科学学报</td>\n",
       "      <td>2021-05-25</td>\n",
       "      <td>NaN</td>\n",
       "      <td>76.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>29</th>\n",
       "      <td>30</td>\n",
       "      <td>基于DTW与K-means算法的河北场雨及雨型分区特征研究</td>\n",
       "      <td>李雨欣;王瑛;马庆媛;刘天雪;司丽丽</td>\n",
       "      <td>地球信息科学学报</td>\n",
       "      <td>2021-05-25</td>\n",
       "      <td>NaN</td>\n",
       "      <td>97.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>30</th>\n",
       "      <td>31</td>\n",
       "      <td>数据挖掘技术在肺癌危险度预测模型中的应用</td>\n",
       "      <td>高孜博;李迪;段书音;周晓蕾;刘红</td>\n",
       "      <td>肿瘤防治研究</td>\n",
       "      <td>2021-05-25</td>\n",
       "      <td>NaN</td>\n",
       "      <td>21.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>31</th>\n",
       "      <td>32</td>\n",
       "      <td>基于大数据和数据挖掘下的商务与经济统计——评《商务与经济统计》</td>\n",
       "      <td>孙玲</td>\n",
       "      <td>热带作物学报</td>\n",
       "      <td>2021-05-25</td>\n",
       "      <td>NaN</td>\n",
       "      <td>6.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>32</th>\n",
       "      <td>33</td>\n",
       "      <td>打造教育人工智能大脑:教育数据中台技术实现路径</td>\n",
       "      <td>李爱霞; 舒杭; 顾小清</td>\n",
       "      <td>开放教育研究</td>\n",
       "      <td>2021-05-24</td>\n",
       "      <td>NaN</td>\n",
       "      <td>330.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>33</th>\n",
       "      <td>34</td>\n",
       "      <td>MGLL在前列腺癌组织中的表达及其对癌细胞生长的调控作用</td>\n",
       "      <td>陈南辉;钟伟枫;潘斌;王晓红;黄志成</td>\n",
       "      <td>暨南大学学报(自然科学与医学版)</td>\n",
       "      <td>2021-05-24</td>\n",
       "      <td>NaN</td>\n",
       "      <td>68.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>34</th>\n",
       "      <td>35</td>\n",
       "      <td>区块链交易网络研究综述  网络首发</td>\n",
       "      <td>吴嘉婧; 刘洁利; 林丹; 郑子彬</td>\n",
       "      <td>中山大学学报(自然科学版)</td>\n",
       "      <td>2021-05-21 16:59</td>\n",
       "      <td>NaN</td>\n",
       "      <td>916.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>35</th>\n",
       "      <td>36</td>\n",
       "      <td>运用数据挖掘和网络药理学探讨糖尿病认知功能障碍中医用药规律和作用机制  网络首发</td>\n",
       "      <td>石崯力; 王旭; 盛沛; 张擎; 梁婕</td>\n",
       "      <td>天然产物研究与开发</td>\n",
       "      <td>2021-05-20 16:44</td>\n",
       "      <td>NaN</td>\n",
       "      <td>222.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>36</th>\n",
       "      <td>37</td>\n",
       "      <td>水电站尾水位特性解析与建模  网络首发</td>\n",
       "      <td>贾本军; 周建中; 陈潇; 张勇传; 田梦琦</td>\n",
       "      <td>水力发电学报</td>\n",
       "      <td>2021-05-20 09:13</td>\n",
       "      <td>NaN</td>\n",
       "      <td>48.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>37</th>\n",
       "      <td>38</td>\n",
       "      <td>基于数据挖掘和网络药理学的早期DN用药规律及机制分析</td>\n",
       "      <td>曲超;张冰冰;姜楠;张柯欣;石岩</td>\n",
       "      <td>沈阳药科大学学报</td>\n",
       "      <td>2021-05-20</td>\n",
       "      <td>NaN</td>\n",
       "      <td>73.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>38</th>\n",
       "      <td>39</td>\n",
       "      <td>计算教育学国内发展现状分析与未来展望——基于语言模型和自然语言生成技术</td>\n",
       "      <td>贾维辰; 彭俊; 任英杰</td>\n",
       "      <td>远程教育杂志</td>\n",
       "      <td>2021-05-20</td>\n",
       "      <td>NaN</td>\n",
       "      <td>74.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>39</th>\n",
       "      <td>40</td>\n",
       "      <td>解码历史——宜兴丁蜀古南街历史风貌保护与更新中的数字技术与实践</td>\n",
       "      <td>唐芃; 王笑; 华好</td>\n",
       "      <td>建筑学报</td>\n",
       "      <td>2021-05-20</td>\n",
       "      <td>NaN</td>\n",
       "      <td>18.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>40</th>\n",
       "      <td>41</td>\n",
       "      <td>人群动态的观测理论及其未来发展思考  网络首发</td>\n",
       "      <td>方志祥</td>\n",
       "      <td>地球信息科学学报</td>\n",
       "      <td>2021-05-19 15:20</td>\n",
       "      <td>NaN</td>\n",
       "      <td>44.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>41</th>\n",
       "      <td>42</td>\n",
       "      <td>基于数据挖掘的国医大师王琦治疗慢性前列腺炎用药规律研究  网络首发</td>\n",
       "      <td>刘桂敏;汤轶波;白雪;陈亚飞;刘丹</td>\n",
       "      <td>中国中医药信息杂志</td>\n",
       "      <td>2021-05-19 10:21</td>\n",
       "      <td>NaN</td>\n",
       "      <td>174.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>42</th>\n",
       "      <td>43</td>\n",
       "      <td>计算法学的疆域</td>\n",
       "      <td>季卫东</td>\n",
       "      <td>社会科学辑刊</td>\n",
       "      <td>2021-05-15</td>\n",
       "      <td>NaN</td>\n",
       "      <td>200.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>43</th>\n",
       "      <td>44</td>\n",
       "      <td>大数据时代高校图书馆智慧服务的逻辑与路径</td>\n",
       "      <td>左平熙</td>\n",
       "      <td>图书馆工作与研究</td>\n",
       "      <td>2021-05-15</td>\n",
       "      <td>NaN</td>\n",
       "      <td>424.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>44</th>\n",
       "      <td>45</td>\n",
       "      <td>大数据技术视域下智慧图书馆伦理危机与控制研究</td>\n",
       "      <td>陆康; 刘慧; 曹畋</td>\n",
       "      <td>高校图书馆工作</td>\n",
       "      <td>2021-05-15</td>\n",
       "      <td>NaN</td>\n",
       "      <td>98.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>45</th>\n",
       "      <td>46</td>\n",
       "      <td>基于数据挖掘的中药专利复方治疗慢性胆囊炎的用药规律分析</td>\n",
       "      <td>郝少东; 杨闪闪; 刘彩萍; 李月廷</td>\n",
       "      <td>中国现代应用药学</td>\n",
       "      <td>2021-05-15</td>\n",
       "      <td>NaN</td>\n",
       "      <td>53.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>46</th>\n",
       "      <td>47</td>\n",
       "      <td>面部色素性疾病中药面膜专利处方分析及作用机制探讨  网络首发</td>\n",
       "      <td>李瑶;付浩;李文林;杨丽丽;曾莉</td>\n",
       "      <td>中国皮肤性病学杂志</td>\n",
       "      <td>2021-05-13 15:49</td>\n",
       "      <td>NaN</td>\n",
       "      <td>128.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>47</th>\n",
       "      <td>48</td>\n",
       "      <td>学习者与平台交互行为挖掘及学习预测模型构建</td>\n",
       "      <td>王亮</td>\n",
       "      <td>中国远程教育</td>\n",
       "      <td>2021-05-12</td>\n",
       "      <td>NaN</td>\n",
       "      <td>260.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>48</th>\n",
       "      <td>49</td>\n",
       "      <td>基于人工智能技术的重大活动食品安全与风险评估综述</td>\n",
       "      <td>李晓理; 卜坤; 翟玉鹏; 王康</td>\n",
       "      <td>北京工业大学学报</td>\n",
       "      <td>2021-05-10</td>\n",
       "      <td>NaN</td>\n",
       "      <td>109.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>49</th>\n",
       "      <td>50</td>\n",
       "      <td>面向智能攻击的行为预测研究</td>\n",
       "      <td>马钰锡; 张全新; 谭毓安; 沈蒙</td>\n",
       "      <td>软件学报</td>\n",
       "      <td>2021-05-09</td>\n",
       "      <td>NaN</td>\n",
       "      <td>232.0</td>\n",
       "      <td>下载</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "    Unnamed: 0                                        篇名  \\\n",
       "0            1                一种基于ELM-AE特征表示的谱聚类算法  网络首发   \n",
       "1            2                   基于数据挖掘的肝癌动物模型应用分析  网络首发   \n",
       "2            3               基于数据挖掘的反流性食管炎动物模型应用分析  网络首发   \n",
       "3            4                    深海富钴结核微区X射线荧光光谱分析和数据挖掘   \n",
       "4            5                  基于数据挖掘的宫颈癌动物模型应用分析  网络首发   \n",
       "5            6                     基于深度学习的知识追踪研究进展  网络首发   \n",
       "6            7                基于数据挖掘的中药治疗宫颈癌用药规律分析  网络首发   \n",
       "7            8     脉络学说理论分析不稳定型心绞痛医案证治规律及网络药理学机制分析  网络首发   \n",
       "8            9        基于数据挖掘的慢性不可预知温和刺激抑郁症动物模型特点分析  网络首发   \n",
       "9           10               古代医籍中治疗筋病内服药规律的数据挖掘研究  网络首发   \n",
       "10          11               企业战略性知识轮廓:化工专利数据挖掘与分析  网络首发   \n",
       "11          12              基于代价敏感卷积神经网络的非平衡问题混合方法  网络首发   \n",
       "12          13        岩石地球化学数据挖掘及弱异常识别——以新疆阿舍勒铜矿为例  网络首发   \n",
       "13          14              基于中医传承辅助平台分析中医药治疗尿源性脓毒症的证治规律   \n",
       "14          15               文本与数据挖掘对著作权例外体系的冲击与应对  网络首发   \n",
       "15          16                     Grover算法改进与应用综述  网络首发   \n",
       "16          17                            甘松中医药用药规律的数据挖掘   \n",
       "17          18                    利用转录组数据挖掘东紫苏单萜生物合成相关基因   \n",
       "18          19                 论坛情感挖掘研究综述：现状、挑战与趋势  网络首发   \n",
       "19          20                  基于CNKI文献计量分析的过程挖掘研究评述与展望   \n",
       "20          21                基于数据挖掘技术的钛合金铣削工艺参数优化  网络首发   \n",
       "21          22                       现代名老中医医案数据库的构建与数据处理   \n",
       "22          23                       基于数据挖掘的冷藏陈列柜的负荷预测研究   \n",
       "23          24               基于LSTM的飞行数据挖掘模型构建方法研究  网络首发   \n",
       "24          25                轨迹数据的时空模式挖掘与管理决策研究综述  网络首发   \n",
       "25          26                        基于新闻大数据的北极地区地缘关系研究   \n",
       "26          27                     基于数据挖掘的中药治疗鼻咽癌的用药规律分析   \n",
       "27          28               基于数据挖掘方法分析曹志群治疗慢性萎缩性胃炎的用药规律   \n",
       "28          29              基于渔船AIS数据的南海北部海洋渔业捕捞强度空间特征挖掘   \n",
       "29          30             基于DTW与K-means算法的河北场雨及雨型分区特征研究   \n",
       "30          31                      数据挖掘技术在肺癌危险度预测模型中的应用   \n",
       "31          32           基于大数据和数据挖掘下的商务与经济统计——评《商务与经济统计》   \n",
       "32          33                   打造教育人工智能大脑:教育数据中台技术实现路径   \n",
       "33          34              MGLL在前列腺癌组织中的表达及其对癌细胞生长的调控作用   \n",
       "34          35                         区块链交易网络研究综述  网络首发   \n",
       "35          36  运用数据挖掘和网络药理学探讨糖尿病认知功能障碍中医用药规律和作用机制  网络首发   \n",
       "36          37                       水电站尾水位特性解析与建模  网络首发   \n",
       "37          38                基于数据挖掘和网络药理学的早期DN用药规律及机制分析   \n",
       "38          39       计算教育学国内发展现状分析与未来展望——基于语言模型和自然语言生成技术   \n",
       "39          40           解码历史——宜兴丁蜀古南街历史风貌保护与更新中的数字技术与实践   \n",
       "40          41                   人群动态的观测理论及其未来发展思考  网络首发   \n",
       "41          42         基于数据挖掘的国医大师王琦治疗慢性前列腺炎用药规律研究  网络首发   \n",
       "42          43                                   计算法学的疆域   \n",
       "43          44                      大数据时代高校图书馆智慧服务的逻辑与路径   \n",
       "44          45                    大数据技术视域下智慧图书馆伦理危机与控制研究   \n",
       "45          46               基于数据挖掘的中药专利复方治疗慢性胆囊炎的用药规律分析   \n",
       "46          47            面部色素性疾病中药面膜专利处方分析及作用机制探讨  网络首发   \n",
       "47          48                     学习者与平台交互行为挖掘及学习预测模型构建   \n",
       "48          49                  基于人工智能技术的重大活动食品安全与风险评估综述   \n",
       "49          50                             面向智能攻击的行为预测研究   \n",
       "\n",
       "                        作者                刊名              发表时间  被引     下载  操作  \n",
       "0                 王丽娟; 丁世飞            智能系统学报  2021-06-15 16:40 NaN    NaN  下载  \n",
       "1                 雷会霞; 苗明三           中药药理与临床  2021-06-15 16:20 NaN    NaN  下载  \n",
       "2            朱正望; 朱平生; 苗明三           中药药理与临床  2021-06-15 15:29 NaN    NaN  下载  \n",
       "3       任江波;王汾连;何高文;张昕;邓希光          光谱学与光谱分析        2021-06-15 NaN    NaN  下载  \n",
       "4     韩艳珍; 白明; 康乐; 张瑾; 苗明三           中药药理与临床  2021-06-09 16:07 NaN   89.0  下载  \n",
       "5         刘铁园; 陈威; 常亮; 古天龙          计算机研究与发展  2021-06-09 15:24 NaN  247.0  下载  \n",
       "6       兰俊;綦向军;莫嘉浩;李丹云;吴金凤           中药药理与临床  2021-06-09 15:00 NaN  172.0  下载  \n",
       "7        王康;李雅文;常丽萍;尹玉洁;朱垚         中国实验方剂学杂志  2021-06-09 14:28 NaN   72.0  下载  \n",
       "8        刘慧娟;康乐;留甜甜;乔靖怡;白明           中药药理与临床  2021-06-09 10:36 NaN   45.0  下载  \n",
       "9                   覃堃; 施展           中药药理与临床  2021-06-08 17:51 NaN   48.0  下载  \n",
       "10                 王江; 郭鑫彬              情报杂志  2021-06-08 17:45 NaN   57.0  下载  \n",
       "11                黄颖琦; 陈红梅             计算机科学  2021-06-08 15:20 NaN   63.0  下载  \n",
       "12     郑超杰;刘攀峰;罗先熔;文美兰;黄文斌          大地构造与成矿学  2021-06-08 11:09 NaN   22.0  下载  \n",
       "13                     姚晓彬         中药新药与临床药理        2021-06-08 NaN   68.0  下载  \n",
       "14                 马治国; 赵龙     西北师大学报(社会科学版)  2021-06-07 17:24 NaN  121.0  下载  \n",
       "15   刘晓楠; 宋慧超; 王洪; 江舵; 安家乐             计算机科学  2021-06-07 14:53 NaN   74.0  下载  \n",
       "16       饶瑶;李冉;王晓雯;薛变霞;李世伟               中草药        2021-06-07 NaN  116.0  下载  \n",
       "17      耿秀文; 张爱丽; 唐仁华; 普春霞               中草药        2021-06-07 NaN   67.0  下载  \n",
       "18       陈迪;程朗;王志锋;熊锦鹏;张玉茹          计算机工程与应用  2021-06-03 16:00 NaN  353.0  下载  \n",
       "19                花龙雪; 吴应良              管理学报        2021-06-01 NaN  364.0  下载  \n",
       "20      刘献礼; 孙庆贞; 岳彩旭; 李恒帅         计算机集成制造系统  2021-05-31 17:09 NaN  142.0  下载  \n",
       "21           赵泽鹏; 戴国华; 高武霖              中医杂志        2021-05-31 NaN  164.0  下载  \n",
       "22      袁培;雷正霖;曾庆辉;武宜霄;吕彦力              流体机械        2021-05-30 NaN   13.0  下载  \n",
       "23  王志刚; 王业光; 杨宁; 米禹丰; 曲晓雷              航空学报  2021-05-27 13:49 NaN  112.0  下载  \n",
       "24        孙爽; 陈燕; 朴在吉; 张金松          计算机工程与应用  2021-05-27 11:44 NaN   94.0  下载  \n",
       "25        李萌;袁文;袁武;牛方曲;李汉青              地理学报        2021-05-25 NaN  191.0  下载  \n",
       "26     方彩珊;綦向军;萧韵婷;莫嘉浩;廖梦颖         中药新药与临床药理        2021-05-25 NaN  241.0  下载  \n",
       "27        战俊邑;张新;丁楠;高慧;严如根         中药新药与临床药理        2021-05-25 NaN  166.0  下载  \n",
       "28       李晓恩;周亮;肖杨;吴文周;苏奋振          地球信息科学学报        2021-05-25 NaN   76.0  下载  \n",
       "29      李雨欣;王瑛;马庆媛;刘天雪;司丽丽          地球信息科学学报        2021-05-25 NaN   97.0  下载  \n",
       "30       高孜博;李迪;段书音;周晓蕾;刘红            肿瘤防治研究        2021-05-25 NaN   21.0  下载  \n",
       "31                      孙玲            热带作物学报        2021-05-25 NaN    6.0  下载  \n",
       "32            李爱霞; 舒杭; 顾小清            开放教育研究        2021-05-24 NaN  330.0  下载  \n",
       "33      陈南辉;钟伟枫;潘斌;王晓红;黄志成  暨南大学学报(自然科学与医学版)        2021-05-24 NaN   68.0  下载  \n",
       "34       吴嘉婧; 刘洁利; 林丹; 郑子彬     中山大学学报(自然科学版)  2021-05-21 16:59 NaN  916.0  下载  \n",
       "35     石崯力; 王旭; 盛沛; 张擎; 梁婕         天然产物研究与开发  2021-05-20 16:44 NaN  222.0  下载  \n",
       "36  贾本军; 周建中; 陈潇; 张勇传; 田梦琦            水力发电学报  2021-05-20 09:13 NaN   48.0  下载  \n",
       "37        曲超;张冰冰;姜楠;张柯欣;石岩          沈阳药科大学学报        2021-05-20 NaN   73.0  下载  \n",
       "38            贾维辰; 彭俊; 任英杰            远程教育杂志        2021-05-20 NaN   74.0  下载  \n",
       "39              唐芃; 王笑; 华好              建筑学报        2021-05-20 NaN   18.0  下载  \n",
       "40                     方志祥          地球信息科学学报  2021-05-19 15:20 NaN   44.0  下载  \n",
       "41       刘桂敏;汤轶波;白雪;陈亚飞;刘丹         中国中医药信息杂志  2021-05-19 10:21 NaN  174.0  下载  \n",
       "42                     季卫东            社会科学辑刊        2021-05-15 NaN  200.0  下载  \n",
       "43                     左平熙          图书馆工作与研究        2021-05-15 NaN  424.0  下载  \n",
       "44              陆康; 刘慧; 曹畋           高校图书馆工作        2021-05-15 NaN   98.0  下载  \n",
       "45      郝少东; 杨闪闪; 刘彩萍; 李月廷          中国现代应用药学        2021-05-15 NaN   53.0  下载  \n",
       "46        李瑶;付浩;李文林;杨丽丽;曾莉         中国皮肤性病学杂志  2021-05-13 15:49 NaN  128.0  下载  \n",
       "47                      王亮            中国远程教育        2021-05-12 NaN  260.0  下载  \n",
       "48        李晓理; 卜坤; 翟玉鹏; 王康          北京工业大学学报        2021-05-10 NaN  109.0  下载  \n",
       "49       马钰锡; 张全新; 谭毓安; 沈蒙              软件学报        2021-05-09 NaN  232.0  下载  "
      ]
     },
     "execution_count": 21,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "element=driver.find_element_by_id('gridTable')\n",
    "data_html=element.get_attribute('innerHTML')\n",
    "pd.read_html(data_html)[0]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 28,
   "metadata": {},
   "outputs": [],
   "source": [
    "driver.find_element_by_xpath('//*[@id=\"selectCheckAll1\"]').click()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 导出refworks"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 29,
   "metadata": {},
   "outputs": [],
   "source": [
    "from selenium.webdriver.common.action_chains import ActionChains\n",
    "move = driver.find_element_by_xpath('//*[@id=\"batchOpsBox\"]/li[2]/a')\n",
    "ActionChains(driver).move_to_element(move).perform()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 30,
   "metadata": {},
   "outputs": [],
   "source": [
    "move = driver.find_element_by_xpath('//*[@id=\"batchOpsBox\"]/li[2]/ul/li[1]/a')\n",
    "ActionChains(driver).move_to_element(move).perform()\n",
    "driver.find_element_by_xpath('//*[@id=\"batchOpsBox\"]/li[2]/ul/li[1]/ul/li[8]/a').click()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 31,
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "<ipython-input-31-3da3279ec0fd>:2: DeprecationWarning: use driver.switch_to.window instead\n",
      "  driver.switch_to_window(driver.window_handles[2])\n"
     ]
    }
   ],
   "source": [
    "driver.window_handles\n",
    "driver.switch_to_window(driver.window_handles[2])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 32,
   "metadata": {},
   "outputs": [],
   "source": [
    "driver.find_element_by_xpath('//*[@id=\"litotxt\"]/a').click()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 33,
   "metadata": {
    "scrolled": false
   },
   "outputs": [
    {
     "data": {
      "text/plain": [
       "['RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 王丽娟;丁世飞;\\n',\n",
       " 'AD 中国矿业大学计算机科学与技术学院;徐州工业职业技术学院信息工程学院;\\n',\n",
       " 'T1 一种基于ELM-AE特征表示的谱聚类算法\\n',\n",
       " 'JF 智能系统学报\\n',\n",
       " 'OP 1-8\\n',\n",
       " 'K1 谱聚类;特征表示;极限学习机;自编码器;ELM-AE;机器学习;聚类分析;数据挖掘\\n',\n",
       " ' spectral clustering;feature representation;extreme machine learning;auto-encoder;ELM-AE;machine learning;clustering analysis;data mining\\n',\n",
       " '\\n',\n",
       " 'AB 在实际应用中，数据点中包含的冗余特征和异常值(噪声)严重影响了聚类中更显著的特征的发现，大大降低了聚类性能。本文提出了一种基于ELM-AE (extreme learning machine as auto encoder)特征表示的谱聚类（spectral clustering， SC）算法（SC-ELM-AE）。ELM-AE通过奇异值分解学习源数据主要特征表示，使用输出权值实现从特征空间到原输入数据的重构；再将该特征表示空间作为输入进行谱聚类。实验表明， 在5个UCI数据集验证中，SC-ELM-AE算法性能优于传统的K-means、谱聚类等现有算法，特别是在复杂高维数据集PEMS-SF和TDT2＿10上，聚类平均精确度均提高30%以上。\\n',\n",
       " 'SN 1673-4785\\n',\n",
       " 'CN 23-1538/TP\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 雷会霞;苗明三;\\n',\n",
       " 'AD 河南中医药大学药学院;\\n',\n",
       " 'T1 基于数据挖掘的肝癌动物模型应用分析\\n',\n",
       " 'JF 中药药理与临床\\n',\n",
       " 'OP 1-13\\n',\n",
       " 'K1 肝癌;动物模型;数据挖掘;造模要素;应用分析\\n',\n",
       " ' Liver cancer;Animal model;Data mining;Modeling elements;Applied analysis\\n',\n",
       " '\\n',\n",
       " 'AB 目的：研究大、小鼠肝癌模型的造模要素、检测指标及其评价方法，为肝癌动物实验方法和科学评价药物效应提供参考。方法：收集肝癌大、小鼠模型相关文献986篇，包含2017年至2020年中文文献和近一年英文文献，将符合纳入标准文献的动物类型、造模方法、阳性药、受试药、观察指标、检测指标等录入Excel，对其种类和指标变化做统计分析。结果：实验动物多为4 w-6 w龄雄性昆明小鼠，6W-12 w龄SD雄性大鼠；小鼠造模方法多为皮下移植法，大鼠造模方法多为药物诱导法和原位移植法；阳性药多选择环磷酰胺、氟尿嘧啶；给药周期多为14 d，灌胃；不同肝癌模型的检测指标有所不同，统计频次较高检测指标有TNF-α、VEGF、IFN-γ、IL-2、Caspase-3、HBx、NKp46、ALT、AST等；模型组大、小鼠肝和脾脏器指数多升高，胸腺脏器指数降低。结论：肝癌各造模方法在研究应用中存在一定的问题，通过挖掘内容进一步指导实验研究应用。\\n',\n",
       " 'SN 1001-859X\\n',\n",
       " 'CN 51-1188/R\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 朱正望;朱平生;苗明三;\\n',\n",
       " 'AD 河南中医药大学;\\n',\n",
       " 'T1 基于数据挖掘的反流性食管炎动物模型应用分析\\n',\n",
       " 'JF 中药药理与临床\\n',\n",
       " 'OP 1-11\\n',\n",
       " 'K1 反流性食管炎;动物模型;数据挖掘;应用分析\\n',\n",
       " ' Reflux esophagitis;Animal model;Data mining;Application analysis\\n',\n",
       " '\\n',\n",
       " 'AB 目的：研究反流性食管炎动物模型的造模要素，为提高造模效率和药物的有效性评价提供方法学参考。方法：以反流性食管炎、模型为主题词，检索中国知网、万方、维普、Web of Science、SinoMed、Pubmed数据库相关期刊文献，收集反流性食管炎动物实验研究文献，录入动物种类、造模方式、给药时间、阳性对照药、检测指标等信息，建立数据文件，进行定量统计和分析。结果：纳入符合标准的期刊文献143篇，常用实验动物为SD大鼠和Wistar大鼠，常用造模方式为幽门部分结扎联合贲门肌切开术，给药时间以14 d居多，阳性药使用最多的是莫沙必利和奥美拉唑，常见检测指标包括食管组织病理、食管粘膜肉眼观察、食管匀浆指标、表观指标、食管组织免疫组化等。结论：反流性食管炎动物模型造模时，建议使用SD大鼠或Wistar大鼠，采用幽门部分结扎联合贲门肌切开术或前胃结扎，给药14 d，阳性药可选择奥美拉唑或莫沙必利，选取食管组织病理、肉眼观察食管粘膜、食管匀浆等指标，为提高造模效率和药物评价提供参考。\\n',\n",
       " 'SN 1001-859X\\n',\n",
       " 'CN 51-1188/R\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 任江波;王汾连;何高文;张昕;邓希光;余红霞;\\n',\n",
       " 'AD 南方海洋科学与工程广东省实验室(广州);自然资源部海底矿产资源重点实验室广州海洋地质调查局;青岛斯八达分析测试有限公司;广西隐伏金属矿产勘查重点实验室桂林理工大学;\\n',\n",
       " 'T1 深海富钴结核微区X射线荧光光谱分析和数据挖掘\\n',\n",
       " 'JF 光谱学与光谱分析\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 06\\n',\n",
       " 'vo 41\\n',\n",
       " 'OP 1834-1840\\n',\n",
       " 'K1 微区X射线荧光;面扫描;大数据;元素分布;富钴结核;西太平洋\\n',\n",
       " ' Microscopic X-ray florescence spectrometer;Map scanning;Big data;Element distribution;Co-rich ferromanganese nodules;Western Pacific Ocean\\n',\n",
       " '\\n',\n",
       " 'AB 西太平洋富钴结核是近年来新发现的海底固体矿产资源,富含Mn, Fe, Co, Ni和Cu等多种关键金属元素。富钴结核是一种非均质的地球化学和矿物学集合体,粒径约6 cm的结核在生长过程中记录了数千万年的海洋沉积历史,亟需高分辨率的分析技术揭示古海洋环境信息。采用微区X射线荧光光谱仪(μ-XRF),对C3BC1704富钴结核开展多元素面扫描,获得了原位高分辨率多元素的信号强度数据,评价了μ-XRF技术在富钴结核中的应用质量。元素信号谱峰特征和数据频谱分布结果显示,富钴结核中Mn, Fe, Ti, Co, Ca和Ni等元素信号强度敏感,数据呈现相对较好的正态分布特征,可用于定量或半定量分析;Si, Cu和Al等元素信号较弱,数据呈现左偏的正态分布特征,建议相关数据仅作参考。μ-XRF获得的数据量庞大且彼此独立,本研究将不同元素连接成彼此关联的多维矩阵,实现了数据的位置信息和特征元素之间的数学运算和筛选,了解了金属元素的分布和变化特征,揭示了富钴结核生长过程的环境变化。结果显示,Mn和Fe等元素在生长层中波动剧烈,金属元素在富钴结核中的分布极不均匀,显示出多成因类型的交替微层和7个大的生长周期旋回。C3BC1704富钴结核主体暴露在海水中,金属元素主要来自海水,化学组成指示为典型的水成成因。进一步定量分析结果显示,Mn, Cu和Ni等元素含量从内部向外围呈现同步降低的趋势,Fe, Ti和Co等元素含量则呈现同步升高的趋势,这些特征指示早期偏向于成岩富集环境,晚期则以水成富集为主。富钴结核金属元素的分布和变化特征,清晰呈现了富钴结核的生长结构,揭示了富钴结核生长过程的环境变化,有利于富钴结核的成矿模型的构建。\\n',\n",
       " 'SN 1000-0593\\n',\n",
       " 'CN 11-2200/O4\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 韩艳珍;白明;康乐;张瑾;苗明三;\\n',\n",
       " 'AD 河南中医药大学药学院;\\n',\n",
       " 'T1 基于数据挖掘的宫颈癌动物模型应用分析\\n',\n",
       " 'JF 中药药理与临床\\n',\n",
       " 'OP 1-10\\n',\n",
       " 'K1 宫颈癌;动物模型;数据挖掘\\n',\n",
       " ' \\n',\n",
       " '\\n',\n",
       " 'AB 方法：以“宫颈癌”、“动物模型”为主题，分别在中国知网、万方、维普、中国生物医学文献数据库、Medline、Pubmed、Cochrane Library、Embase数据库中检索关于宫颈癌的动物实验研究性文献，检索年限均为2000—2020年，归纳总结文献中实验动物种类、造模方法、造模时间以及相关检测指标等，建立宫颈癌动物模型数据库进行分析统计。结果：共筛选得到符合标准的实验研究性文献286 篇，其中中文文献213 篇、外文文献73 篇，通过总结分析发现，使用BALB/c雌性裸鼠进行宫颈癌模型复制最为常见；造模方法使用最多的是皮下接种U14癌细胞，其中皮下接种部位多在背部皮下；成模时间大多为7 d；在指标检测中，检测最多的指标是肿瘤组织表观指标（形态、体积、重量等）、抑瘤率、肿瘤组织病理、小鼠整体表观指标（状态、鼠毛颜色等）、肿瘤组织免疫组化、血清中相关生化指标等。结论： 目前对宫颈癌的实验研究及理论探讨与临床宫颈癌的发病现状严重失衡，需要增加实验研究为临床治疗宫颈癌奠定基础；文章对不同动物模型进行评估，为宫颈癌疾病不同研究目的提供最佳模型。\\n',\n",
       " 'SN 1001-859X\\n',\n",
       " 'CN 51-1188/R\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 刘铁园;陈威;常亮;古天龙;\\n',\n",
       " 'AD 广西可信软件重点实验室(桂林电子科技大学);桂林电子科技大学电子工程与自动化学院;暨南大学信息科学与技术学院/网络安全学院;\\n',\n",
       " 'T1 基于深度学习的知识追踪研究进展\\n',\n",
       " 'JF 计算机研究与发展\\n',\n",
       " 'OP 1-24\\n',\n",
       " 'K1 教育数据挖掘;深度学习;知识追踪;循环神经网络;人工智能辅助教育\\n',\n",
       " ' education data mining;deep learning;knowledge tracing;recurrent neural network;artificial intelligence assisted education\\n',\n",
       " '\\n',\n",
       " 'AB 知识追踪是教育数据挖掘领域的一个重要研究方向，其目标是通过建立学生知识状态随时间变化的模型，来判断学生对知识的掌握程度并从学生的学习轨迹中挖掘出潜在的学习规律，从而提供个性化的指导，达到人工智能辅助教育的目的.深度学习因其强大的特征提取能力，已被证明能显著提升知识追踪模型的性能而越来越受到各方重视.以最基本的深度知识追踪模型为起点，全面回顾了该研究领域的研究进展，给出了该研究领域技术改进、演化脉络图，并从针对可解释问题的改进、针对长期依赖问题的改进、针对缺少学习特征问题的改进3个主要技术改进方向做了深入阐述和比较分析，同时对该领域中的已有模型做了归类，整理了可供研究者使用的公开数据集，考察了其主要应用，最后，对基于深度学习的知识追踪的未来研究方向进行了展望．\\n',\n",
       " 'SN 1000-1239\\n',\n",
       " 'CN 11-1777/TP\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 兰俊;綦向军;莫嘉浩;李丹云;吴金凤;萧韵婷;冯静茹;肖静;胡向丹;\\n',\n",
       " 'AD 广州中医药大学中药学院;广州中医药大学第一临床医学院;广州中医药大学第二临床医学院;广东省中医院妇科;\\n',\n",
       " 'T1 基于数据挖掘的中药治疗宫颈癌用药规律分析\\n',\n",
       " 'JF 中药药理与临床\\n',\n",
       " 'OP 1-18\\n',\n",
       " 'K1 中药;宫颈癌;数据挖掘;用药规律\\n',\n",
       " ' TCM;Cervical cancer;Data mining;Medication rules\\n',\n",
       " '\\n',\n",
       " 'AB 目的：探索中药方剂治疗子宫颈癌的成方规律，为临床组方用药及成药开发提供参考。方法：运用SPSS Clementine 12.0软件，SPSS 18.0软件对《肿瘤良方大全》《肿瘤方剂大辞典》《卫生部药品标准中药成方制剂》以及《国家药品标准（修订）颁布件》上记载的宫颈癌方剂进行频次统计、关联规则分析、系统聚类分析及因子分析。结果：本研究共纳入306个方剂，包含420味中药。高频药物以清热解毒药和补血药为主。关联规则分析得到二项关联规则共26条，三项关联规则8条。系统聚类分析得出10个关联紧密的药组，因子分析共得出14个公因子。结论：中药方剂治疗子宫颈癌的成方规律为抗癌解毒药与补气药为主，补血药与活血化瘀药为辅。扶正为先，以肝为重，兼顾脾胃；祛邪为辅，清热利湿，抗癌解毒。\\n',\n",
       " 'SN 1001-859X\\n',\n",
       " 'CN 51-1188/R\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 王康;李雅文;常丽萍;尹玉洁;朱垚;吴晨;贾振华;\\n',\n",
       " 'AD 河北中医学院;络病研究与创新中药国家重点实验室;南京中医药大学;河北以岭医院;\\n',\n",
       " 'T1 脉络学说理论分析不稳定型心绞痛医案证治规律及网络药理学机制分析\\n',\n",
       " 'JF 中国实验方剂学杂志\\n',\n",
       " 'OP 1-15\\n',\n",
       " 'K1 脉络学说营卫理论;不稳定型心绞痛;数据挖掘;网络药理学;证治规律\\n',\n",
       " ' Yingwei Theory of Vessel-collateral Theory;Unstable angina pectoris;Data mining;Network pharmacology;Rules of Syndrome and Treatment\\n',\n",
       " '\\n',\n",
       " 'AB 目的：以脉络学说营卫理论为指导系统分析整理不稳定型心绞痛（UAP）现代医案，探析UAP证治规律，并利用网络药理学对证治规律中核心药对治疗UAP的分子机制进行分析。方法：通过PubMed、CNKI、WanFang、VIP、SinoMed数据库检索自建库至2020年11月所有中药复方治疗UAP相关医案，基于脉络学说营卫理论医案证候判定标准对医案进行证候判定，运用频数统计、系统聚类分析、FP-Growth加强关联分析等数据挖掘方法挖掘UAP证治规律，并利用网络药理学对证治规律中核心药对治疗UAP的分子机制进行分析。结果：研究显示UAP高频证候前四位依次为络气虚滞、瘀血阻络、络气郁滞及痰浊阻络，高频药物有丹参、甘草、川芎、黄芪等，主要药物以化瘀通络、益气固卫、理气解郁及祛痰通络药为主；药物关联规则得到UAP治疗核心药对丹参-川芎-黄芪；药物系统聚类共得到4组药物组合；网络药理学分析显示核心药对丹参-川芎-黄芪治疗UAP的关键成分有槲皮素、木犀草素、丹参酮IIA等，其中关键靶点有: 丝氨酸/苏氨酸蛋白激酶1（AKT1）、丝裂原活化蛋白激酶1(MAPK1)、JUN蛋白(JUN)、白介素-6（IL-6）、丝裂原活化蛋白激酶8(MAPK8)。KEGG通路分析显示磷脂酰肌醇3激酶-丝氨酸/苏氨酸蛋白激酶(PI3K-Akt)信号通路可能是其发挥治疗作用的主要途径。结论：UAP以络气虚（郁）滞、痰瘀阻络为基本病机；治疗以益气化瘀通络为基本治法，兼以理气化痰通络；核心药对丹参-川芎-黄芪治疗UAP的机制具有多成分、多靶点、多通路特点，研究结果为后续脉络学说指导UAP相关分子水平研究提供了思路。\\n',\n",
       " 'SN 1005-9903\\n',\n",
       " 'CN 11-3495/R\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 刘慧娟;康乐;留甜甜;乔靖怡;白明;苗明三;\\n',\n",
       " 'AD 河南中医药大学;\\n',\n",
       " 'T1 基于数据挖掘的慢性不可预知温和刺激抑郁症动物模型特点分析\\n',\n",
       " 'JF 中药药理与临床\\n',\n",
       " 'OP 1-12\\n',\n",
       " 'K1 抑郁症动物模型;慢性不可预知温和刺激;数据挖掘;检测指标;模型评价;机制\\n',\n",
       " ' Animal model of depression;Chronic unpredictable mild stress;Data mining;Detection indicators;Evaluation of animal model;Mechanism\\n',\n",
       " '\\n',\n",
       " 'AB 抑郁症是目前精神疾病的研究热点，其病因较多，机制较复杂。建立可靠、易复制且重复性较好的抑郁症动物模型是研究抑郁症机制的关键要素，现有的抑郁症动物模型主要有慢性刺激、药物诱导、嗅球切除三类，其中慢性不可预知温和刺激（Chronic unpredictable mild stimulation，CUMS）抑郁模型更符合临床抑郁症动物模型制备特点，且与临床病症具有较好的吻合度。基于此，通过数据挖掘的方式探讨CUMS抑郁模型的特点，分析实验动物的选择以及各项指标的检测特点，为抑郁症动物模型的制备以及药物研究提供参考。\\n',\n",
       " 'SN 1001-859X\\n',\n",
       " 'CN 51-1188/R\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 覃堃;施展;\\n',\n",
       " 'AD 中国中医科学院中医临床基础医学研究所;北京中医药大学;\\n',\n",
       " 'T1 古代医籍中治疗筋病内服药规律的数据挖掘研究\\n',\n",
       " 'JF 中药药理与临床\\n',\n",
       " 'OP 1-11\\n',\n",
       " 'K1 筋病;口服;数据挖掘;关联规则;组方配伍;用药规律\\n',\n",
       " ' Jin disease;Internal drugs;Data mining;Association rules;Formula compatibility;Medication rules\\n',\n",
       " '\\n',\n",
       " 'AB 目的：探讨古代医籍中治疗筋病内服方剂的用药与组方规律，以期对筋病的临床治疗及新药研发提供参考。方法：收集整理《中华医典单机版V5.0》中治疗筋病共129首内服方剂，涉及186味中药，录入中医传承辅助系统（V2.5），采用改进的互信息法、关联规则、核心算法、熵层次聚类，统计单药、对药、角药出现频次，并分析关联规则、提取核心组合、发现新方，进行数据挖掘研究。结果：最常见单药是当归（78次，占41.94%）；最常见对药是当归-肉桂（39次，占30.23%）；最常见角药是没药-乳香-当归（21次，占16.28%）、赤芍-川芎-当归（21次，占16.28%）；关联度最高的药物组合是乳香+当归→没药（置信度为1.0000）；得到24组3至4味药的核心组合，核心药物为：当归、肉桂、没药、川芎、赤芍、乳香等；得到内服治疗筋病12个新候选处方。结论：提示中药内服治疗筋病以及新药研发时，单药、对药、角药优先考虑当归、肉桂、没药、乳香；配伍优先考虑乳香、当归配伍没药；核心方剂优先考虑木香、沉香、藿香等；新候选处方优先考虑木香、沉香、藿香、独活等。\\n',\n",
       " 'SN 1001-859X\\n',\n",
       " 'CN 51-1188/R\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 王江;郭鑫彬;\\n',\n",
       " 'AD 北京化工大学经济管理学院;\\n',\n",
       " 'T1 企业战略性知识轮廓:化工专利数据挖掘与分析\\n',\n",
       " 'JF 情报杂志\\n',\n",
       " 'OP 1-10\\n',\n",
       " 'K1 专利分析;主题模型;聚类分析;趋势预测;绿色化工\\n',\n",
       " ' patent analysis;topic model;clustering analysis;trend prediction;green chemical technology\\n',\n",
       " '\\n',\n",
       " 'AB [目的/意义]在知识经济时代,专利分析能更好地接近企业潜在战略模式和技术核心的发展轨迹。[方法/过程]以化工领域的优秀企业的专利数据库为实例,将LDA(Latent Dirichlet Allocation)主题模型、聚类分析和分层时间序列趋势预测相结合,对企业战略性知识轮廓进行挖掘、分析和预测。[结果/结论]研究结果显示了化工行业内各企业在战略性知识轮廓上的不同,揭示了化工行业中新兴和衰退的知识领域的动态,清晰展现出行业领导者受绿色化工理念所影响的技术战略的演变。\\n',\n",
       " 'SN 1002-1965\\n',\n",
       " 'CN 61-1167/G3\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 黄颖琦;陈红梅;\\n',\n",
       " 'AD 西南交通大学信息科学与技术学院;西南交通大学云计算与智能技术高校重点实验室;\\n',\n",
       " 'T1 基于代价敏感卷积神经网络的非平衡问题混合方法\\n',\n",
       " 'JF 计算机科学\\n',\n",
       " 'OP 1-15\\n',\n",
       " 'K1 非平衡问题;卷积神经网络;过采样;数据预处理;代价敏感损失函数\\n',\n",
       " ' Imbalance classification;Convolutional neural network;Oversampling;Data preprocessing;Cost-sensitive loss function\\n',\n",
       " '\\n',\n",
       " 'AB 非平衡问题是数据挖掘领域中普遍存在的一个问题，数据的偏态分布会使得分类器的分类效果不理想。卷积神经网络作为一种高效的数据挖掘工具，被广泛应用于分类任务，但其训练过程若受到数据非平衡的不利影响，则将导致少数类的分类准确率下降。针对二分类非平衡数据分类问题，文中提出了一种基于代价敏感卷积神经网络的非平衡问题混合方法。首先将密度峰值聚类算法与SMOTE相结合，通过过采样对数据进行预处理，降低原始数据集的不平衡程度；然后利用代价敏感的思想对非平衡数据中不同类别给予不同权重，并考虑预测值与标签值之间的欧氏距离，对非平衡数据中多数类和少数类赋予不同的代价损失，构建代价敏感卷积神经网络模型，以提高卷积神经网络对少数类的识别率。选取6个不同的数据集，用于验证所提方法的有效性。实验结果表明，所提方法可以提高卷积神经网络模型对非平衡数据的分类性能。\\n',\n",
       " 'SN 1002-137X\\n',\n",
       " 'CN 50-1075/TP\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 郑超杰;刘攀峰;罗先熔;文美兰;黄文斌;刘刚;吴晓贵;邱炜;陈泽粟;肖辉;魏超城;\\n',\n",
       " 'AD 桂林理工大学地球科学学院;桂林理工大学环境科学与工程学院;中国建筑材料工业地质勘查中心广西总队;宁夏回族自治区地质矿产勘查院;新疆维吾尔自治区地质矿产勘查开发局;青海省地质调查院;新疆哈巴河阿舍勒铜业股份有限公司;\\n',\n",
       " 'T1 岩石地球化学数据挖掘及弱异常识别——以新疆阿舍勒铜矿为例\\n',\n",
       " 'JF 大地构造与成矿学\\n',\n",
       " 'OP 1-16\\n',\n",
       " 'K1 成分数据分析;多重分形;深边部找矿预测;新疆阿舍勒\\n',\n",
       " ' compositional data analysis;multifractal technology;peripheral orebody prediction;Ashele district\\n',\n",
       " '\\n',\n",
       " 'AB 勘查地球化学找矿工作的重点在于正确解译地球化学数据,以便从冗杂的地质信息中精准提取与成矿有关的异常信息,指导找矿研究。然而,地球化学数据属于成分数据,具有闭合效应,只有对数据进行正确的预处理才能应用多元统计分析方法,还原元素真实的空间分布。本文在阿舍勒铜锌矿区外围南侧区域共收集1009件地表原生晕样品,对样品中的13种微量元素进行测试,并对原始数据、对数及ilr变换后的数据进行EDA分析,对比数据空间分布及内部结构特征。运用(稳健)主成分分析,结合成分数据双标图及第一主成分点位图,解译三类数据指示的元素组合与成矿信息之间的关联。随后运用多重分形滤波技术,对以ilr变换为基础的稳健主成分得分数据分解元素组合异常和背景分布特征。结果表明:(1)经过对数及ilr变换后的数据相比原始数据空间尺度更均匀,数据近似正态分布;(2)三类数据双标图表明,仅ilr变换后的数据消除了“闭合效应”,且其第一主成分元素分组揭示了研究区铜矿化与铅锌多金属矿化组合;以对数变换与ilr变换为基础的第一主成分点位图表明,后者主成分得分异常能够较好指示研究区地质找矿信息;(3)结合研究区地质找矿信息、元素组合异常及背景空间分布特征,最终圈定3个有利找矿靶区。\\n',\n",
       " 'SN 1001-1552\\n',\n",
       " 'CN 44-1595/P\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 姚晓彬;\\n',\n",
       " 'AD 广东省中医院;\\n',\n",
       " 'T1 基于中医传承辅助平台分析中医药治疗尿源性脓毒症的证治规律\\n',\n",
       " 'JF 中药新药与临床药理\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 06\\n',\n",
       " 'vo 32\\n',\n",
       " 'OP 862-868\\n',\n",
       " 'K1 尿源性脓毒症;辨证论治;组方规律;数据挖掘;中医传承辅助平台;八正散\\n',\n",
       " ' Urosepsis;treatment based on syndrome differentiation;prescription rules;data mining;TCM inheritance support platform;Bazheng San\\n',\n",
       " '\\n',\n",
       " 'AB 目的研究中医药治疗尿源性脓毒症的辨证论治规律。方法回顾性研究广东省中医院治疗尿源性脓毒症的患者病历资料,采用Microsoft Excel软件收集患者的证型及方药,并录入中医传承辅助平台(V2.5)。按年龄分为中青年组与老年组,分析两组患者的证型分布、处方药物频次、核心组合及药物关联规则,提取处方内在核心组合并演化新方组合。结果 (1)共纳入110个医案,辨证分型以实热证和瘀热证等实证居多,处方涉及101味中药。(2)中青年组用药频次较高的有滑石、泽泻、车前子,常用药物组合有滑石+栀子、瞿麦+萹蓄、萹蓄+萆薢等,并挖掘出核心组合12个和新方剂6个,蒲公英、车前草、金钱草等为核心组方中药,蒲公英、车前草、金钱草、山药、黄芪、白术等为新方组成中药。(3)老年组用药频次较高的有泽泻、车前草、甘草等,常用药物组合有金银花+车前草、蒲公英+车前草、石韦+车前草等,并挖掘出中药核心组合12个和新方剂6个,蒲公英、紫花地丁、白术等为核心组方中药,蒲公英、麦冬、熟地黄、车前草等为新方组成中药。结论尿源性脓毒症中医辨证以实证居多,中青年组与老年组患者的用药均以清热解毒、利尿通淋为主药,方剂多以八正散为基础方,可根据不同的中医证型随证加减。但老年患者在用药上比中青年较为平和;所得新方可为临床上辨证治疗尿源性脓毒症提供一定参考。\\n',\n",
       " 'SN 1003-9783\\n',\n",
       " 'CN 44-1308/R\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 马治国;赵龙;\\n',\n",
       " 'AD 西安交通大学法学院;\\n',\n",
       " 'T1 文本与数据挖掘对著作权例外体系的冲击与应对\\n',\n",
       " 'JF 西北师大学报(社会科学版)\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 04\\n',\n",
       " 'OP 107-115\\n',\n",
       " 'K1 文本与数据挖掘;著作权;合理使用;技术措施\\n',\n",
       " ' text and data mining;copyright exception;fair use;technical measures\\n',\n",
       " '\\n',\n",
       " 'AB 我国现有的著作权例外体系无法为文本与数据挖掘提供豁免,故挖掘行为存在侵犯著作权相关财产性权利的风险。通过对比日本、欧盟以及美国的相关司法与立法经验,认为我国文本与数据挖掘借鉴美国模式概括性适用合理使用条款是目前最具可行性的应对策略。为了使文本与数据挖掘自洽于著作权例外体系,还应采取将“四要素分析法”作为判断“三步检验法”的要件、提供合法授权的“第三方规避者”以及保持技术措施保护例外的开放性等举措。\\n',\n",
       " 'SN 1001-9162\\n',\n",
       " 'CN 62-1086/C\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 刘晓楠;宋慧超;王洪;江舵;安家乐;\\n',\n",
       " 'AD 数学工程与先进计算国家重点实验室(信息工程大学);\\n',\n",
       " 'T1 Grover算法改进与应用综述\\n',\n",
       " 'JF 计算机科学\\n',\n",
       " 'OP 1-19\\n',\n",
       " 'K1 Grover算法;量子计算;相位改进;密钥搜索;数据挖掘\\n',\n",
       " ' Grover algorithm;Quantum computing;Phase improvement;Key search;Data mining\\n',\n",
       " '\\n',\n",
       " 'AB 量子信息科学是一门新兴的交叉学科，它在信息领域中有着独特的性能，在提高运算速度、确保信息安全、增大信息容量和提高检测精度等方面可突破现有经典信息系统的极限。Grover算法是一类典型的量子算法，能够对任意经典暴力穷举搜索问题实现二次加速，进一步推动了量子计算的发展，如何有效地改进和应用Grover算法成为量子计算的一个重要研究领域。文中综述了Grover算法的优化改进和应用，对Grover算法在不同领域应用及不同方面的改进进行了概述，并对Grover算法未来算法改进和相关应用的若干研究方向进行了探讨。\\n',\n",
       " 'SN 1002-137X\\n',\n",
       " 'CN 50-1075/TP\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 饶瑶;李冉;王晓雯;薛变霞;李世伟;赵悦;张丽花;徐砚通;吴红华;\\n',\n",
       " 'AD 天津中医药大学中医药研究院组分中药国家重点实验室;北京中医药大学北京中医药研究院;\\n',\n",
       " 'T1 甘松中医药用药规律的数据挖掘\\n',\n",
       " 'JF 中草药\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 11\\n',\n",
       " 'vo 52\\n',\n",
       " 'OP 3331-3343\\n',\n",
       " 'K1 甘松;中医药;数据挖掘;频次统计;关联规则;聚类分析\\n',\n",
       " ' Nardostachys jatamansi DC.;traditional Chinese medicine;data mining;frequency statistics;Apriori algorithm;hierarchical cluster analysis\\n',\n",
       " '\\n',\n",
       " 'AB 目的从含甘松Nardostachyos Radix et Rhizoma的中医药处方和中药组合物专利中挖掘甘松的中医药用药规律,为甘松现代临床应用和开发提供依据。方法检索《中华医方》《中医方剂大辞典》《中国药典》2020年版等工具书及华柄数据、中医资源网、中国知网、万方等数据库中含甘松的中医药处方和中药组合物专利。运用Excel 2019、SPSS Modeler 18.0和SPSS Statistics 25软件,进行组成药物的频次统计、关联规则分析和聚类分析。结果含甘松的中医药处方最终纳入372首,涉及《中国药典》收载药物374种,与甘松组合用药频次最高的前10味药为白芷、香附、甘草、木香、川芎、细辛、山柰、丁香、当归和砂仁,功效分类以解表药为主,主治疾病以脾系病类最多,核心药物组合为木香分气丸加减方。含甘松的中药组合物专利最终纳入1533项,涉及《中国药典》收载药物565种,与甘松组合用药频次最高的前10味药为甘草、白芷、丁香、当归、茯苓、川芎、木香、肉桂、黄芪和陈皮,功效分类以补益药为主,主治疾病以脾系病类为首,比传统中医药处方发展了更多的药物组合。结论含甘松的中医药处方与中药组合物专利中药物组成均以解表药、补益药、理气药、活血药、温里药和清热药为主;甘松多与辛、苦、甘味,性温、寒、平,归脾、肝、胃、肺、心、肾经的药物配伍;常用于治疗脾系病类,皮肤病类,躯体痹、痿、瘤等病类,脑系病类和心系病类,与甘松国内外现代药理研究结果基本一致。\\n',\n",
       " 'SN 0253-2670\\n',\n",
       " 'CN 12-1108/R\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 耿秀文;张爱丽;唐仁华;普春霞;\\n',\n",
       " 'AD 云南中医药大学中药材优良种苗繁育工程中心;\\n',\n",
       " 'T1 利用转录组数据挖掘东紫苏单萜生物合成相关基因\\n',\n",
       " 'JF 中草药\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 11\\n',\n",
       " 'vo 52\\n',\n",
       " 'OP 3373-3382\\n',\n",
       " 'K1 东紫苏;转录组;GPP合酶;单萜生物合成;代谢途径\\n',\n",
       " ' Elsholtzia bodinieri Vaniot;transcriptome;GPP synthase;monoterpene biosynthesis\\n',\n",
       " '\\n',\n",
       " 'AB 目的获得东紫苏Elsholtzia bodinieri转录组数据信息,了解东紫苏挥发油单萜生物合成途径。方法采用Illumina Hiseq 2000高通量测序获得东紫苏的转录组数据,通过对数据进行组装、拼接及注释,挖掘其单萜类化合物代谢途径相关基因。结果东紫苏2个样品材料测序后共获得13.67Gb数据,91169356条高质量序列,利用Trinity组装获得93327条unigenes,平均长度1756 bp。将组装所得到的unigenes分别与NCBI官方的蛋白序列数据库(RefSeq non-redundant proteins,NR)、基因本体论数据库(gene ontology,GO)、真核生物蛋白质同源簇数据库(clusters of orthologous groups for eukaryotic complete genomes,KOG)、京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)等数据库进行BLAST比对分析。通过KEGG代谢通路分析,结果显示有2个单萜代谢相关途径,为萜类骨架生物合成(编号为ko00900)和单萜类生物合成(编号为ko00902),相关unigenes分别有11条和30条;进行实时荧光定量PCR(reverse transcription PCR,RT-PCR)和测序,成功验证6个单萜合成相关候选基因全长unigenes。结论首次对东紫苏进行高通量转录组测序分析,获得了单萜生物合成的关键酶基因,为后续基因功能的研究奠定基础。\\n',\n",
       " 'SN 0253-2670\\n',\n",
       " 'CN 12-1108/R\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 陈迪;程朗;王志锋;熊锦鹏;张玉茹;黎高赞;\\n',\n",
       " 'AD 华中师范大学人工智能教育学部;\\n',\n",
       " 'T1 论坛情感挖掘研究综述：现状、挑战与趋势\\n',\n",
       " 'JF 计算机工程与应用\\n',\n",
       " 'OP 1-14\\n',\n",
       " 'K1 论坛;情感挖掘;情感词典;机器学习\\n',\n",
       " ' forum;sentiment mining;sentiment lexicon;machine learning\\n',\n",
       " '\\n',\n",
       " 'AB 大数据时代，论坛上用户的看法、倾向、观点和争论形成了大量数据。对这些能表达作者情绪的数据进行挖掘，有助于相关人员对信息的理解、把控，亦会对决策形成直接影响。为此，关注论坛情感挖掘十分重要。首先从论坛数据挖掘相关技术的概念和意义出发，重点讨论了论坛情感挖掘中基于情感词典和基于机器学习两种方法的研究现状，对每种方法的适用任务、不足之处、改进方案、发展趋势等进行对比和阐述。最后给出论坛情感挖掘领域尚待解决的难题与挑战，并对该技术未来的发展方向做出预测。\\n',\n",
       " 'SN 1002-8331\\n',\n",
       " 'CN 11-2127/TP\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 花龙雪;吴应良;\\n',\n",
       " 'AD 华南理工大学电子商务系;华南理工大学数字商务与智能物流研究院;\\n',\n",
       " 'T1 基于CNKI文献计量分析的过程挖掘研究评述与展望\\n',\n",
       " 'JF 管理学报\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 06\\n',\n",
       " 'vo 18\\n',\n",
       " 'OP 938-948\\n',\n",
       " 'K1 过程挖掘;知识图谱;VOSviewer;Citespace\\n',\n",
       " ' process mining;knowledge map;VOSviewer;Citespace\\n',\n",
       " '\\n',\n",
       " 'AB 为探析国内过程挖掘领域的研究发展,以1998～2019年中国知网(CNKI)收录的过程挖掘相关文献为样本,综合运用VOSviewer和Citespace两款软件,对文献特征、热点主题和前沿趋势进行分析。研究表明:过程挖掘研究在国内起步较晚,跨学科对话不足;领域研究主要围绕过程发现与支持、合规性检查与增强、工作流挖掘及领域应用4个主题。从发展趋势上看,在线过程挖掘和学科应用研究越来越受到关注,设计普适性强、能够处理高度复杂日志的挖掘算法始终是该领域的研究重点。未来应在加强跨学科交叉研究的同时,促进过程挖掘与物联网、人工智能、区块链等技术的深度融合。\\n',\n",
       " 'SN 1672-884X\\n',\n",
       " 'CN 42-1725/C\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 刘献礼;孙庆贞;岳彩旭;李恒帅;\\n',\n",
       " 'AD 哈尔滨理工大学先进制造智能化技术教育部重点实验室;\\n',\n",
       " 'T1 基于数据挖掘技术的钛合金铣削工艺参数优化\\n',\n",
       " 'JF 计算机集成制造系统\\n',\n",
       " 'OP 1-15\\n',\n",
       " 'K1 数据挖掘;分步聚类;T.K-means算法;MapReduce架构;铣削参数优化\\n',\n",
       " ' data mining;step by step clustering;T.K-means algorithm;MapReduce framework;milling parameters optimization\\n',\n",
       " '\\n',\n",
       " 'AB 随着大数据时代的来临，传统数据挖掘技术已不能满足智能制造背景下海量数据处理的要求。针对海量数据在挖掘过程中出现的计算能力不足，挖掘效率低下现状，提出在云计算环境下，以分步聚类理念为基础，对经典K-means聚类算法进行改进，并将改进的算法与Hadoop平台的MapReduce计算架构相结合，实现算法计算并行化，从而形成能够应对海量数据挖掘任务的新算法T.K-means。为了验证新算法的实用性能，以虚拟铣削Ti-6Al-4V(TC4)钛合金加工运行数据为挖掘对象，利用T.K-means算法挖掘加工工艺参数与工件表面粗糙度之间的关系，得到可调控工艺参数的优化值以指导实际加工。挖掘结果表明，T.K-means算法可用于TC4钛合金铣削工艺参数优化目标值的确定，其所挖掘出的工艺参数能够反应机床铣削加工TC4钛合金表面粗糙度的最佳运行状态。\\n',\n",
       " 'SN 1006-5911\\n',\n",
       " 'CN 11-5946/TP\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 赵泽鹏;戴国华;高武霖;\\n',\n",
       " 'AD 山东中医药大学;山东中医药大学附属医院;\\n',\n",
       " 'T1 现代名老中医医案数据库的构建与数据处理\\n',\n",
       " 'JF 中医杂志\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 11\\n',\n",
       " 'vo 62\\n',\n",
       " 'OP 951-955\\n',\n",
       " 'K1 中医医案;数据库;名老中医;数据处理\\n',\n",
       " ' medical cases of traditional Chinese medicine;database;famous doctors of traditional Chinese medicine;data processing\\n',\n",
       " '\\n',\n",
       " 'AB 运用数据挖掘技术构建医案数据库是归纳和总结名医经验的常用方法。为了提升数据挖掘结果的使用价值,探讨现代名老中医医案数据库的构建方式,在优化数据库结构与常用字段的基础上,借助HanLP分词系统,应用结合最大概率算法的隐马尔可夫模型(HMM)分词算法进行医案文本的切分与语义标注,并通过python根据语义标注结果进行医案信息提取。该方法有助于优化医案数据结构,提升了数据库的构建效率和数据挖掘质量。\\n',\n",
       " 'SN 1001-1668\\n',\n",
       " 'CN 11-2166/R\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 袁培;雷正霖;曾庆辉;武宜霄;吕彦力;胡朝龙;\\n',\n",
       " 'AD 郑州轻工业大学;山东小鸭冷链有限公司;\\n',\n",
       " 'T1 基于数据挖掘的冷藏陈列柜的负荷预测研究\\n',\n",
       " 'JF 流体机械\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 05\\n',\n",
       " 'vo 49\\n',\n",
       " 'OP 87-90+104\\n',\n",
       " 'K1 负荷预测;LSTM神经网络模型;损失函数;冷藏陈列柜\\n',\n",
       " ' load forecasting;LSTM neural network model;loss function;refrigerated display cabinet\\n',\n",
       " '\\n',\n",
       " 'AB 为了挖掘冷藏陈列柜运行数据的有效信息,实现冷藏陈列柜制冷负荷的预测,针对运行数据存在时间序列性和非线性等特性,提出了基于深度学习的LSTM神经网络模型。将日期信息、蒸发器进出口温度、压力、焓值、流量数据按照时间步长划分为训练集与测试集,模型导入后经过训练证明最优方案:模型网络层数为4、训练次数为200,将预测负荷数据与实际负荷进行比对,发现预测模型绝对百分比误差仅为1.98%,具备较好的预测性能。\\n',\n",
       " 'SN 1005-0329\\n',\n",
       " 'CN 34-1144/TH\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 王志刚;王业光;杨宁;米禹丰;曲晓雷;\\n',\n",
       " 'AD 沈阳飞机设计研究所飞行控制部;\\n',\n",
       " 'T1 基于LSTM的飞行数据挖掘模型构建方法研究\\n',\n",
       " 'JF 航空学报\\n',\n",
       " 'OP 1-10\\n',\n",
       " 'K1 LSTM;飞行历史数据;数据挖掘;模式识别;模型构建\\n',\n",
       " ' LSTM;Flight History Data;Data Mining;Pattern Recognition;Model Construction\\n',\n",
       " '\\n',\n",
       " 'AB 提出了一种基于LSTM模型的飞行历史数据挖掘模型的构建方法，此模型可以将飞行数据中有价值的目标数据自动提取出来。主要的应用就是先通过滑动窗口法获得待检测数据，再通过将预先做好的训练样本数据输入到所构造的LSTM模型当中进行训练，得到数据挖掘模型，最后将待检测数据导入到训练好的LSTM模型当中进行模式识别，将目标数据片段挖掘出来。结果表明，基于LSTM模型的飞行数据挖掘模型构建方法通用化程度高，可用于挖掘不同类型的目标数据，且识别率高具有很高的工程应用价值。\\n',\n",
       " 'SN 1000-6893\\n',\n",
       " 'CN 11-1929/V\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 孙爽;陈燕;朴在吉;张金松;\\n',\n",
       " 'AD 大连海事大学航运经济与管理学院;大连外国语大学软件学院;\\n',\n",
       " 'T1 轨迹数据的时空模式挖掘与管理决策研究综述\\n',\n",
       " 'JF 计算机工程与应用\\n',\n",
       " 'OP 1-12\\n',\n",
       " 'K1 轨迹数据;轨迹预处理;时空模式挖掘;管理决策\\n',\n",
       " ' trajectory data;trajectory preprocessing;spatiotemporal pattern mining;management decision\\n',\n",
       " '\\n',\n",
       " 'AB 时空轨迹数据的获取变得越来越容易，轨迹数据刻画了移动对象的行为模式与活动规律，是对移动对象在时空环境下的移动模式和行为特征的真实写照，在城市规划、交通管理、服务推荐、位置预测等领域具有重要的应用价值。这些过程通常需要通过对时空轨迹数据进行模式挖掘才能得以实现。首先简述轨迹数据挖掘的预处理和基本步骤，归纳了异常轨迹检测方法的分类，然后分析、总结了近年来基于轨迹数据的四种模式挖掘，最后从管理决策角度对轨迹数据挖掘进行相关综述和分析，有望为轨迹数据的模式挖掘与管理决策提供必要的文献资料和理论基础。\\n',\n",
       " 'SN 1002-8331\\n',\n",
       " 'CN 11-2127/TP\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 李萌;袁文;袁武;牛方曲;李汉青;胡段牧;\\n',\n",
       " 'AD 中国科学院地理科学与资源研究所;中国科学院大学;北京理工大学计算机学院;公安部第一研究所;\\n',\n",
       " 'T1 基于新闻大数据的北极地区地缘关系研究\\n',\n",
       " 'JF 地理学报\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 05\\n',\n",
       " 'vo 76\\n',\n",
       " 'OP 1090-1104\\n',\n",
       " 'K1 北极地区;地缘关系;时空数据挖掘;主题模型;交互网络;大数据\\n',\n",
       " ' Arctic;geographical relationship;spatiotemporal data mining;topic model;interactive network;big data\\n',\n",
       " '\\n',\n",
       " 'AB 随着全球气候变暖,北极地区海冰大面积消融,引发了严重环境问题,同时使得北极航道成为可能,北极地区的战略地位显著提升。作为近北极国家,北极地区国际关系变化对中国的北极政策有直接影响。全面实时地分析北极地区地缘关系及其变化特征,对中国制定北极地区的政治、经济、外交政策具有重要指导作用。海量全球实时开放数据库的出现以及大数据技术的发展,如GDELT新闻事件数据库提供了覆盖全世界的源于各国主要媒体服务平台的新闻数据,为地缘关系实时监控及分析提供了可能性。本文利用GDELT数据库,引入labeledLDA主题分析的理论与方法,挖掘了2013—2019年北极圈内8个国家和地区社会发展关键要素,构建了国家(地区)交互网络,发现了北极地区国家(地区)之间关系的演变格局。主要结论为:(1)北极地区热点新闻主题聚焦于气候变化/冰盖融化,冰盖融化是北极地缘关系变化的主要驱动因子;(2)冰盖融化新闻热度与海冰监测数据变化存在极强的相关性;(3)随着冰盖融化,北极地区的社会经济军事活动激增,其主导权的争夺日趋激烈,总体呈现出俄罗斯、加拿大主导的格局。\\n',\n",
       " 'SN 0375-5444\\n',\n",
       " 'CN 11-1856/P\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 方彩珊;綦向军;萧韵婷;莫嘉浩;廖梦颖;谢淼;周敏;陈腾宇;王顺兰;阮岩;\\n',\n",
       " 'AD 广州中医药大学;广州中医药大学第一附属医院;\\n',\n",
       " 'T1 基于数据挖掘的中药治疗鼻咽癌的用药规律分析\\n',\n",
       " 'JF 中药新药与临床药理\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 05\\n',\n",
       " 'vo 32\\n',\n",
       " 'OP 716-721\\n',\n",
       " 'K1 鼻咽癌;中医药治疗;用药规律;数据挖掘;白花蛇舌草;清热解毒\\n',\n",
       " ' Nasopharyngeal carcinoma;traditional Chinese medicine therapy;application rules of Chinese medicine;data mining;Oldenlandia diffusa;clearing heat and detoxifying\\n',\n",
       " '\\n',\n",
       " 'AB 目的以数据挖掘方法对中药治疗鼻咽癌的用药规律进行分析,为鼻咽癌的中医治疗以及中成药的研发提供借鉴。方法以《肿瘤方剂大辞典》、《肿瘤良方大全》、《中国药典》、《国家中成药标准汇编》以及《卫生部药品标准中药成方制剂》为数据来源,按照纳入和排除标准遴选中药治疗鼻咽癌的方剂,运用Microsoft Excel 2010进行频数统计,以SPSS Clementine 12.0软件中所提供的Apriori模版进行关联规则分析,用SPSS18.0软件进行聚类分析和因子分析。结果最终纳入中药方剂292个,共有369味中药。用药频次居前11%的中药有38味(频次≥17次),主要以清热解毒药、扶正补虚药、以毒攻毒药、温经消积药、活血化瘀药以及宣通鼻窍药为主;关联规则分析得到药对41个,3味药组18个,4味药组18个;聚类分析得到治疗鼻咽癌的潜在核心基础方6个;因子分析得到药组13个。结论中药治疗鼻咽癌多以滋阴清热解毒、益气健脾、活血化瘀、宣通鼻窍为治则,其核心病机为本虚邪盛。白花蛇舌草作为岭南地区颇具特色的清热解毒类中草药,在鼻咽癌中医治疗中应用频次最高,体现其在鼻咽癌治疗中具有重要价值。\\n',\n",
       " 'SN 1003-9783\\n',\n",
       " 'CN 44-1308/R\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 战俊邑;张新;丁楠;高慧;严如根;赵玉洁;曹志群;\\n',\n",
       " 'AD 山东中医药大学;山东中医药大学附属医院;山东第一医科大学附属省立医院;\\n',\n",
       " 'T1 基于数据挖掘方法分析曹志群治疗慢性萎缩性胃炎的用药规律\\n',\n",
       " 'JF 中药新药与临床药理\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 05\\n',\n",
       " 'vo 32\\n',\n",
       " 'OP 733-738\\n',\n",
       " 'K1 慢性萎缩性胃炎;因子分析;聚类分析;数据挖掘;用药规律;补益脾胃;运脾化湿;行气活血;消食化积\\n',\n",
       " ' Chronic atrophic gastritis;factor analysis;cluster analysis;data mining;medication rule;tonifying the spleen and stomach;transporting spleen and resolving dampness;promoting qi and activating blood circulation;digestion and alleviating accumulation\\n',\n",
       " '\\n',\n",
       " 'AB 目的探讨曹志群教授治疗慢性萎缩性胃炎(CAG)的用药规律。方法收集曹志群教授2016年11月至2020年1月治疗CAG的门诊病案,筛选、整理后建立数据库。使用Microsoft Excel 2019进行药物频数及性味归经分析,利用IBM SPSS 23.0软件进行因子分析和系统聚类分析。结果根据纳入、排除标准共收集处方191首,涉及中药162味。高频药物有砂仁、半夏、炒白术、丹参、党参、黄芪、枳壳、香附等;药物功效以补虚、理气、化湿为主;药性以温性为主,药味以苦、辛、甘为主,归经以脾、胃经为主;因子分析共提取公因子7个;系统聚类分析得到新处方5首。结论曹志群教授围绕CAG\"中焦虚损\"的基本病机,治疗从脾、胃出发,以补虚祛实、虚实兼顾为治疗准则,重视补益脾胃,同时注意调节脏腑气机升降,辅以运脾化湿、行气活血、消食化积等治法。\\n',\n",
       " 'SN 1003-9783\\n',\n",
       " 'CN 44-1308/R\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 李晓恩;周亮;肖杨;吴文周;苏奋振;石伟;\\n',\n",
       " 'AD 兰州交通大学测绘与地理信息学院;中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室;地理国情监测技术应用国家地方联合工程研究中心;甘肃省地理国情监测工程实验室;南京大学地理与海洋科学学院;中国南海研究协同创新中心;中国科学院南海生态环境工程创新研究院;\\n',\n",
       " 'T1 基于渔船AIS数据的南海北部海洋渔业捕捞强度空间特征挖掘\\n',\n",
       " 'JF 地球信息科学学报\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 05\\n',\n",
       " 'vo 23\\n',\n",
       " 'OP 850-859\\n',\n",
       " 'K1 渔船AIS;大数据;南海北部海洋渔业;数据分析与挖掘;混合高斯模型;捕捞强度;空间特征分析;渔业资源可持续\\n',\n",
       " ' fishing vessels AIS data;big data;Northern South China Sea fishery;data analysis and mining;Gaussian mixture model;fishing intensity;spatial characteristics analysis;sustainable marine fisheries\\n',\n",
       " '\\n',\n",
       " 'AB 高精度渔业捕捞强度数据是开展捕捞限额管理的前提与关键,也是海洋渔业资源可持续发展的重要保障。因此,本文以挖掘海洋渔业捕捞强度空间特征为出发点,选用2018年2、4、9和11月典型季节的中国籍6364艘渔船1.8亿条高时空粒度AIS数据。运用专家知识经验、空间统计及数据挖掘分析方法,以广西南岸北部湾渔场、广东沿岸和环海南岛周边海域为研究区域,对渔业捕捞强度空间特征展开了细致的挖掘与分析。结果表明:(1)广东、广西两省(以下简称\"两广\")沿岸海域渔业高强度捕捞主要呈现\"团块\"向外扩张汇聚成\"条带\"或\"更大团块\"的特征,而环海南岛周边主要呈现\"团块状\"特征;(2)受渔业从业人员、渔业作业船舶数量、海洋渔场及海域环境影响,\"两广\"沿岸近海海域捕捞强度明显高于环海南岛周边海域;(3)高强度捕捞区域主要集中于近岸30～50 km范围内,且近海捕捞强度高于远海区域,归因于研究区内中小型作业渔船占比较高,达50.9%;(4)渔业捕捞活动受农历传统春节及休渔期等政策因素的影响,春节期间的渔业捕捞强度是所选数据覆盖时间范围中最低的,并且休渔期后(9月)渔业捕捞强度明显高于休渔期前(4月);(5)研究区海岸附近的大型渔港对近岸海域的高强度捕捞具有一定的辐射带动效应。本研究通过对高时空粒度的AIS数据进行处理、分析及深度挖掘,可为近岸海洋渔业捕捞强度探析提供重要数据支撑,服务于海洋渔业可持续发展。\\n',\n",
       " 'SN 1560-8999\\n',\n",
       " 'CN 11-5809/P\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 李雨欣;王瑛;马庆媛;刘天雪;司丽丽;俞海洋;\\n',\n",
       " 'AD 北京师范大学环境演变与自然灾害教育部重点实验室;应急管理部-教育部减灾与应急管理研究院;河北省气象灾害防御中心;\\n',\n",
       " 'T1 基于DTW与K-means算法的河北场雨及雨型分区特征研究\\n',\n",
       " 'JF 地球信息科学学报\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 05\\n',\n",
       " 'vo 23\\n',\n",
       " 'OP 860-868\\n',\n",
       " 'K1 场雨;雨型;数据挖掘;DTW相似性算法;K-means聚类;暴雨灾情;区划;河北\\n',\n",
       " ' field rain;rainfall type;data mining;DTW;K-means clustering;rainstorm disaster;zoning;Hebei\\n',\n",
       " '\\n',\n",
       " 'AB 深入挖掘气象站点的观测降雨数据,研究区域降雨的雨型规律,对于洪涝灾害预警和减灾措施制订有重要意义。本文基于河北省2005—2017年3189个站点逐小时降雨观测数据,进行\"场雨\"的划定,进而提取历史上各场雨的累积雨量、时长指标。采用数据挖掘技术中的DTW相似性算法进行场雨雨型的自动归类,将场雨分成Ⅰ—Ⅶ共7种雨型,包括峰值在前、中、后期的3种单峰型降雨,以及3种双峰型降雨和均匀型降雨,结果显示:河北降雨过程以Ⅰ型前期单峰值降雨、Ⅲ型中期单峰值降雨居多,二者占总降雨场次的70%以上,但空间分布上存在差异;通过K-means聚类,将河北地区分成3个雨型区:(1)区,Ⅰ型和Ⅲ型降雨为主,分布在燕山丘陵气候区、冀东平原气候区和山前平原气候区。(2)区,Ⅲ型、Ⅰ型、Ⅵ型、Ⅶ型降雨并重,在冀北高原气候区,承德市南部等分散分布。(3)区,Ⅲ型降雨为主,主要分布在石家庄市南部、邯郸市、邢台市大部分地区。本文将DTW相似性算法和K-means聚类方法相结合的数据挖掘技术,可以在未来的气象大数据分析中得到更多的应用。\\n',\n",
       " 'SN 1560-8999\\n',\n",
       " 'CN 11-5809/P\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 高孜博;李迪;段书音;周晓蕾;刘红;王静;王威;吴拥军;\\n',\n",
       " 'AD 郑州大学公共卫生学院;河南省胸科医院呼吸内科;郑州大学第一附属医院呼吸内科;\\n',\n",
       " 'T1 数据挖掘技术在肺癌危险度预测模型中的应用\\n',\n",
       " 'JF 肿瘤防治研究\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 05\\n',\n",
       " 'vo 48\\n',\n",
       " 'OP 479-483\\n',\n",
       " 'K1 肺癌;C5.0决策树;人工神经网络;风险预测\\n',\n",
       " ' Lung neoplasms;Decision trees C5.0;Artificial neural network;Risk prediction\\n',\n",
       " '\\n',\n",
       " 'AB 目的使用数据挖掘技术建立肺癌危险度预测模型,比较C5.0决策树与人工神经网络用于肺癌风险预测的性能,并探讨其在肺癌风险预测中的价值。方法选择180例肺癌患者及240例肺良性疾病患者,收集肺癌相关危险因素和临床症状共17个自变量,建立C5.0决策树与人工神经网络模型,比较模型的预测性能。结果共收集420份病历资料,将所有样本按7:3随机分为训练集样本和测试集样本。人工神经网络模型的测试集准确度为65.3%、敏感度为61.7%、特异性为73.3%、约登指数为0.350、阳性预测值为54.9%、阴性预测值为73.1%、AUC为0.675(95%CI:0.628～0.720)。C5.0决策树模型的测试集准确度为61.0%、敏感度为47.8%、特异性80.4%、约登指数为0.282、阳性预测值为35.3%、阴性预测值为80.6%、AUC为0.641(95%CI:0.593～0.687)。结论人工神经网络模型整体性能优于C5.0决策树,在肺癌危险度的预测中具有潜在的应用价值。\\n',\n",
       " 'SN 1000-8578\\n',\n",
       " 'CN 42-1241/R\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 孙玲;\\n',\n",
       " 'AD 淄博职业学院;\\n',\n",
       " 'T1 基于大数据和数据挖掘下的商务与经济统计——评《商务与经济统计》\\n',\n",
       " 'JF 热带作物学报\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 05\\n',\n",
       " 'vo 42\\n',\n",
       " 'OP 1523\\n',\n",
       " 'K1 数据挖掘;《商务与经济统计》;\\n',\n",
       " ' \\n',\n",
       " '\\n',\n",
       " 'AB <正>在大数据时代环境下,开展商务与经济统计实践时,通过发挥大数据与数据挖掘优势,收集商务与经济运行数据,将数据信息集中收录于数据库,有效确保了数据挖掘的精准度,为当前有效开展商务与经济统计活动提供有效支持。本文将结合《商务与经济统计》一书,分析大数据和数据挖掘下的商务与经济统计方向,\\n',\n",
       " 'SN 1000-2561\\n',\n",
       " 'CN 46-1019/S\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 李爱霞;舒杭;顾小清;\\n',\n",
       " 'AD 华东师范大学教育信息技术学系;江南大学教育信息化研究中心;\\n',\n",
       " 'T1 打造教育人工智能大脑:教育数据中台技术实现路径\\n',\n",
       " 'JF 开放教育研究\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 03\\n',\n",
       " 'vo 27\\n',\n",
       " 'OP 96-103\\n',\n",
       " 'K1 教育人工智能大脑;数据中台;智能化;大数据\\n',\n",
       " ' educational artificial intelligence brain;data middle platform;intelligent education;big data\\n',\n",
       " '\\n',\n",
       " 'AB 在智能时代,基于教育数据打造驱动教育不断发展的\"教育人工智能大脑\",是一个前沿而紧迫的问题。数据中台的出现为实现教育数据的快速流转与价值发掘,构建最强的教育大脑带来可能。本研究首先分析了教育数据中台之于\"教育是什么\"\"为什么\"\"将来会怎样\"以及\"如何应对\"等教育应用的前景及OneData的核心运行机制;然后从教育数据采集层、数据存储层、数据开发层、数据服务层和数据治理层等方面剖析教育数据中台的技术架构;最后结合当前教育数据中台建设的基本情况,从顶层数据意识引导、基础设施建设和智能服务生态三方面提出教育数据中台的实现路径,以期为教育数据中台的落地做铺设。\\n',\n",
       " 'SN 1007-2179\\n',\n",
       " 'CN 31-1724/G4\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 陈南辉;钟伟枫;潘斌;王晓红;黄志成;江惠明;谭万龙;\\n',\n",
       " 'AD 南方医科大学南方医院泌尿外科;梅州市人民医院泌尿外科;暨南大学附属第一医院泌尿外科;南方医科大学第三附属医院肾内科;\\n',\n",
       " 'T1 MGLL在前列腺癌组织中的表达及其对癌细胞生长的调控作用\\n',\n",
       " 'JF 暨南大学学报(自然科学与医学版)\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 03\\n',\n",
       " 'vo 42\\n',\n",
       " 'OP 234-241\\n',\n",
       " 'K1 前列腺癌;单酰甘油脂酶;预后;生物信息学\\n',\n",
       " ' prostate cancer;monoacylglycerol lipase(MGLL);prognosis;bioinformatical data mining\\n',\n",
       " '\\n',\n",
       " 'AB 目的:探索单酰甘油脂酶(MGLL)在前列腺癌(PCa)中的表达及其临床预后.方法:利用基因表达谱交互分析(GEPIA),Oncomine及人类蛋白质图谱(THPA)生物信息学工具,分析癌症公共数据库TCGA及GEO中PCa及对照样本中MGLL的mRNA及蛋白表达情况,基于TCGA数据库中的PCa病人样本信息进行生存分析,观察MGLL与成纤维细胞生长因子(FGF)/磷脂酰肌醇3-激酶(PI3K)/蛋白激酶B (AKT)信号通路中关键蛋白的共表达相关性.通过Western blot检测MGLL在PCa细胞系中的表达;通过Transwell检测过表达MGLL对PCa细胞系迁移和侵袭的作用.结果:Oncomine数据库中检索到6组PCa研究队列,GEPIA工具共有492例PCa样本及52例前列腺对照样本.发现在Oncomine的多个PCa队列研究中,与对照前列腺组织相比,MGLL mRNA在PCa组织中显著低表达(P<0.021).GEPIA分析的TCGA队列显示,MGLL在PCa中的mRNA水平亦显著降低(P<0.01).THPA在线工具表明,MGLL蛋白在正常前列腺组织中高表达,而在PCa组织中低表达.蛋白水平与mRNA水平趋势一致.GEPIA的生存分析表明,MGLL表达水平与PCa患者总生存期(OS)和无瘤生存期(DFS)密切相关,MGLL低表达患者的预后较差(P=0.018;P=0.034).蛋白共表达分析表明,PCa中MGLL与FGF受体FGFR1、PIK3CA、AKT2、GSK-3B及CRMP2均成正相关(R=0.6,P=0;R=0.36,P=0;R=0.22,P<0.001;R=0.36,P=0;R=0.5,P=0).Western blot检测表明MGLL在多个PCa细胞系中低表达,且过表达MGLL会抑制PCa细胞的迁移和侵袭能力(P<0.05).结论:MGLL在PCa组织及癌细胞系中低表达,且与癌患者预后相关,其机制可能与PI3K/AKT/GSK-3B信号通路相关.\\n',\n",
       " 'SN 1000-9965\\n',\n",
       " 'CN 44-1282/N\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 吴嘉婧;刘洁利;林丹;郑子彬;\\n',\n",
       " 'AD 中山大学计算机学院;中山大学软件工程学院;\\n',\n",
       " 'T1 区块链交易网络研究综述\\n',\n",
       " 'JF 中山大学学报(自然科学版)\\n',\n",
       " 'OP 1-12\\n',\n",
       " 'K1 区块链;加密货币交易;复杂网络;数据挖掘\\n',\n",
       " ' blockchain;cryptocurrency transactions;complex networks;data mining\\n',\n",
       " '\\n',\n",
       " 'AB 自以比特币为代表的区块链加密货币交易平台诞生以来，基于区块链技术的加密货币获得了广泛的关注并积累了大量的交易数据。这些交易记录包含了丰富的信息和完整的金融活动痕迹，为研究者在这一领域进行知识发现提供了前所未有的机会。网络是描述现实世界中交互系统的通用语言，现有的区块链交易研究中有相当一部分是从网络的角度来进行的。本综述旨在从网络科学的角度分析和总结现有的有关区块链加密货币交易的文献。首先介绍了加密货币交易网络分析的背景信息，然后从交易网络建模、交易网络分析和交易网络上的识别技术3个方面对现有研究进行了综述，希望能为从事相关领域的研究者提供一个系统的指导。\\n',\n",
       " 'SN 0529-6579\\n',\n",
       " 'CN 44-1241/N\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 石崯力;王旭;盛沛;张擎;梁婕;\\n',\n",
       " 'AD 南京中医药大学第一临床医学院;\\n',\n",
       " 'T1 运用数据挖掘和网络药理学探讨糖尿病认知功能障碍中医用药规律和作用机制\\n',\n",
       " 'JF 天然产物研究与开发\\n',\n",
       " 'OP 1-19\\n',\n",
       " 'K1 糖尿病认知功能障碍;中医药;数据挖掘;网络药理学;用药规律\\n',\n",
       " ' diabetes cognitive dysfunction;traditional Chinese medicine;data mining;network pharmacology;medication rules\\n',\n",
       " '\\n',\n",
       " 'AB 本文旨在通过探讨中医药治疗糖尿病认知功能障碍的用药特点与规律，为临床用药提供新的参考。运用中国知网（CNKI）、万方数据（WF）、维普期刊全文数据库（VIP）、生物医学文献数据库（CBM）、及中国科学引文数据库（CSCD）检索自1999年1月至2020年10月收载的中医药治疗糖尿病认知功能障碍文献，经筛选后建立数据库，运用Microsoft Excel 2019、SPSS Modeler 18.0、SPSS Statistics 25.0软件进行数据挖掘，分析用药规律。通过检索TCMSP、OMIM、TTD、Pharm Gkb和Drugbank数据库获得核心药物组合和疾病的有效活性成分，利用Cytoscape3.8.0软件构建“化合物-靶点”作用网络图，运用Stitch和String构建蛋白质-蛋白质相互作用（PPI）网络，并通过Cytoscape进行网络拓扑分析获得药物和疾病交互的核心靶点。筛选DAVID数据库对核心靶点进行GO和KEGG富集分析。结果共纳入文献33篇，中药处方123首，获得高频中药20味，桃仁-红花、当归-桃仁-川芎、熟地黄-菟丝子-枸杞子等26对核心药物组合，通过因子分析提取8个公因子，聚类分析得到6类，得到核心组方的有效活性成分109个，药物潜在基因靶点1 620个，疾病潜在基因靶点1 490个，核心组方治疗疾病的核心靶点76个，涉及237条GO富集功能和96条KEGG通路。发现中医治疗糖尿病认知功能障碍以活血化瘀、化痰开窍、滋益固肾为原则，其核心药物治疗糖尿病认知功能障碍的作用机制可能与胰岛素抵抗、细胞凋亡、炎症反应、内质网应激等密切相关。\\n',\n",
       " 'SN 1001-6880\\n',\n",
       " 'CN 51-1335/Q\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 贾本军;周建中;陈潇;张勇传;田梦琦;\\n',\n",
       " 'AD 华中科技大学土木与水利工程学院;华中科技大学数字流域科学与技术湖北省重点实验室;\\n',\n",
       " 'T1 水电站尾水位特性解析与建模\\n',\n",
       " 'JF 水力发电学报\\n',\n",
       " 'OP 1-15\\n',\n",
       " 'K1 水电站尾水位特性;尾水位预测;相关性分析;多项式拟合;支持向量回归\\n',\n",
       " ' hydropower station tailwater level characteristics;tailwater level prediction;Pearson correlation analysis;polynomial fitting;support vector regression\\n',\n",
       " '\\n',\n",
       " 'AB 围绕如何准确解析水电站的尾水位特性并对其进行建模，从而实现尾水位高精度预测的问题，首先，采用定性与定量分析相结合的方法揭示了水电站尾水位变化的后效性特征，其次，基于相关性分析初步探明了尾水位变化过程的关键影响因子，进一步，构建了水电站尾水位特性的多项式拟合模型和支持向量回归模型，并对比分析了各模型描述水电站尾水位特性的性能。溪洛渡-向家坝梯级和三峡-葛洲坝梯级水电站的实例研究表明，四座水电站2小时尺度的尾水位变化过程后效性特征显著，以当前和前一时段的下泄流量以及下游电站水位或下游支流来水为输入的支持向量回归模型是一种实用性、可靠性和准确性均衡的具有实际工程应用价值的尾水位预测模型。\\n',\n",
       " 'SN 1003-1243\\n',\n",
       " 'CN 11-2241/TV\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 曲超;张冰冰;姜楠;张柯欣;石岩;张文顺;\\n',\n",
       " 'AD 辽宁中医药大学;\\n',\n",
       " 'T1 基于数据挖掘和网络药理学的早期DN用药规律及机制分析\\n',\n",
       " 'JF 沈阳药科大学学报\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 05\\n',\n",
       " 'vo 38\\n',\n",
       " 'OP 498-512\\n',\n",
       " 'K1 早期糖尿病肾病;数据挖掘;配伍规律;网络药理学;分子对接\\n',\n",
       " ' Diabetic Nephropathy;data mining;combination rules;network pharmacology;molecular docking\\n',\n",
       " '\\n',\n",
       " 'AB 目的基于古今医案云平台挖掘现代医案治疗早期DN的用药规律并分析作用机制。方法检索中医药治疗早期DN有效验案进行数据挖掘,导入Gephi进行复杂网络分析、可视化展示,分析早期DN的常见证候及核心配伍。通过TCMSP数据库检索核心配伍的主要化合物成分和作用靶点,TTD、DisGeNET、GeneCards等数据库查询DN相关靶点。利用Cytoscape构建化合物-靶点网络、PPI网络筛选出核心靶点,进行GO注释、KEGG通路富集分析,运用PyMOL、AutoDock等进行分子对接。结果纳入112篇文献,包含150首方剂,271味中药,常见证候为气阴两虚证,核心配伍为\"黄芪-山药\"。筛选后得到核心化合物成分11个、靶点28个,BP条目385个,CC条目58个,MF条目139个,生物通路88条。\"黄芪-山药\"治疗DN存在多靶点协同作用情况,作用机制可能是通过调节PTGS2、NCOA2、PTGS1、HSP90AA1、PRSS1等核心靶点,及通过干预IL-17、TNF、Regulation of lipolysis in adipocytes、C-type lectin receptor、Endocrine resistance等相关信号通路。分子对接结果显示核心化合物成分主要与核心靶点甘氨酸,天冬酰胺,组氨酸等氨基酸残基发生氢键、疏水、范德华力等发生相互作用,结合能均低于-5.6 kcal/mol。结论气阴两虚证为DN常见证型,\"黄芪-山药\"为其核心配伍,中医药治疗早期DN以健脾益气、滋补肝肾之药补虚,兼顾活血化瘀、清热利湿治标,为标本同治。本研究揭示了\"黄芪-山药\"治疗DN的潜在分子机制,为后续研究提供理论依据及参考。\\n',\n",
       " 'SN 1006-2858\\n',\n",
       " 'CN 21-1349/R\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 贾维辰;彭俊;任英杰;\\n',\n",
       " 'AD 澳门城市大学教育学院;暨南大学人文学院;\\n',\n",
       " 'T1 计算教育学国内发展现状分析与未来展望——基于语言模型和自然语言生成技术\\n',\n",
       " 'JF 远程教育杂志\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 03\\n',\n",
       " 'vo 39\\n',\n",
       " 'OP 42-51\\n',\n",
       " 'K1 学术文本分析;计算教育学;文献计量;自然语言生成;语言模型\\n',\n",
       " ' Academic Text Analysis;Computational Education;Bibliometrics;Natural Language Generation;Language Model\\n',\n",
       " '\\n',\n",
       " 'AB 近年来,大数据、人工智能等新兴技术的飞速发展,推动着计算教育学逐步走向成熟,并受到研究者的广泛关注。为此,从计算教育学发展脉络展开分析,梳理出计算教育学领域的主要支撑技术与应用场景。基于梳理结果,对CNKI数据库2001年到2019年研究文献进行分析,构建了计算教育学领域学术文本(摘要)语料库。应用\"学术文本(摘要)主题分析框架\"对语料库进行数据挖掘,研究发现了计算教育学领域语言模型与四个重要聚类,即\"个性化学习\"\"智慧课堂\"\"智慧校园\"\"创客教育\"。研究认为,加快形成计算教育学特有的研究范式,合力构建计算教育学技术生态系统,加强计算教育学学科人才培养尤其是研究人员的培养,将是未来计算教育学研究与发展的主要问题和重要抓手。\\n',\n",
       " 'SN 1672-0008\\n',\n",
       " 'CN 33-1304/G4\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 唐芃;王笑;华好;\\n',\n",
       " 'AD 东南大学建筑学院;东南大学建筑运算与应用研究所;城市与建筑遗产保护教育部重点实验室(东南大学);\\n',\n",
       " 'T1 解码历史——宜兴丁蜀古南街历史风貌保护与更新中的数字技术与实践\\n',\n",
       " 'JF 建筑学报\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 05\\n',\n",
       " 'OP 24-30\\n',\n",
       " 'K1 传统聚落;历史风貌;保护与更新;数字链;生成设计;丁蜀古南街\\n',\n",
       " ' traditional settlement;historical feature;conservation and renewal;digital chain;generative design;Gunanjie Street\\n',\n",
       " '\\n',\n",
       " 'AB 针对传统建筑聚落中大量非文保单位的保护问题,尝试将数字技术运用到其历史风貌的保护更新设计中。通过建立\"数据收集-特征提取-生成设计\"的数字链闭环,借助数据挖掘和程序生成来帮助评价及重构符合当地传统的历史风貌;并结合实践案例,具体阐述数据、规则和程序工具如何在二维立面风貌和三维空间肌理的研究中发挥作用。\\n',\n",
       " 'SN 0529-1399\\n',\n",
       " 'CN 11-1930/TU\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 方志祥;\\n',\n",
       " 'AD 武汉大学测绘遥感信息工程国家重点实验室;\\n',\n",
       " 'T1 人群动态的观测理论及其未来发展思考\\n',\n",
       " 'JF 地球信息科学学报\\n',\n",
       " 'OP 1-10\\n',\n",
       " 'K1 人群动态观测;城市动态感知;时空过程;时空建模;时空服务;数字化治理;公共安全;公共卫生\\n',\n",
       " ' crowd dynamics observation;urban dynamics sensing;spatiotemporal progress;spatiotemporal modelling;space-time service;digital governance;public security;public health\\n',\n",
       " '\\n',\n",
       " 'AB 在“新冠”肺炎疫情发展过程中，人群动态的观测理论研究与应用受到了国内外许多研究人员和民众的重点关注，特别是公共卫生学、临床医学、地理学、公共管理学等多学科交叉，探索科学的疫情动态监测、精准防控、准确预测与有效应对等方面的理论与方法。本文首先系统介绍人群动态的观测理论研究背景和意义，概括地描述其核心的3个问题（观测其如何变、分析其为何变、控制其如何变），从信息地理学、测绘学等领域角度阐述人群动态的观测理论研究意义及其学科价值。接着，围绕人群动态的观测与时空应用，本文阐述地理时空大数据背景下人群动态的关键观测理论框架（如基础时空理论、时空定量与综合观测理论、时空过程优化理论等），及其所存在的瓶颈问题和发展需求。然后，结合未来理论研究与关注变化，阐述了4个典型的人群动态观测理论趋势变化，包括：数字化社会治理与公共安全/卫生应急等需求驱动下的精细化观测、公共利益至上与个人保护最大化兼顾下的差异化观测、对人观测与对地观测的集成化观测理论发展、高阶需求层次管控与服务的人群动态观测理论突破。最后，本文强调在多学科交叉背景下，指出重点发展人群大数据感知、多空间精细化观测、人地系统化建模等方面的基础理论与方法，实现差异化、集成化、层次化的对人观测，系统支撑面向地学的研究与时空应用，科学支撑不可逆的管理、控制、服务等社会治理现实应用决策。该方面理论研究，将对“新城镇化”、“美丽中国”、“人工智能”、“新基建”等国家战略中城市和区域的绿色、高效、智慧与可持续发展等都有重要支撑作用。\\n',\n",
       " 'SN 1560-8999\\n',\n",
       " 'CN 11-5809/P\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 刘桂敏;汤轶波;白雪;陈亚飞;刘丹;樊晓蕾;马茹;常征辉;李博怿;李玲孺;郑燕飞;刘振权;\\n',\n",
       " 'AD 北京中医药大学中药学院;北京中医药大学中医学院;北京中医药大学国家中医体质与治未病研究院;\\n',\n",
       " 'T1 基于数据挖掘的国医大师王琦治疗慢性前列腺炎用药规律研究\\n',\n",
       " 'JF 中国中医药信息杂志\\n',\n",
       " 'OP 1-7\\n',\n",
       " 'K1 王琦;慢性前列腺炎;中医传承辅助平台;数据挖掘;用药规律\\n',\n",
       " ' Wang Qi;chronic prostatitis;TCM Inheritance Support System;data mining;medication rules\\n',\n",
       " '\\n',\n",
       " 'AB 目的 基于中医传承辅助平台V2.5分析国医大师王琦治疗慢性前列腺炎的用药规律。方法 收集2016年9月－2019年9月王琦在北京中医药大学国医堂门诊治疗慢性前列腺炎的病案，将符合纳入标准的病案录入中医传承辅助平台V2.5，利用频次统计功能及关联规则分析、复杂系统熵聚类分析、无监督熵层次聚类分析对用药规律进行分析。结果共纳入慢性前列腺炎病案65个，涉及药物178味，处方122首。药物药性以寒、温、平为主，药味以苦、甘、辛为主，归经以肝经为主，其次为胃、脾、心经。药物频次按降序排列，前8味中药与当归贝母苦参丸高度相似，排名第9～16味的中药与复元活血汤高度相似。药物类别统计显示，前6类分别为活血调经类、利尿通淋类、化瘀止血类、清热燥湿类、理气类、补血类。关联规则分析显示，核心药物组合多由当归贝母苦参丸合复元活血汤药物加减，具有清热祛湿排浊、化瘀通络止痛之功，能够治疗湿热瘀浊阻滞前列腺、精窍不畅等症。聚类分析得出24个新核心药物组合、12首药物新处方。结论王琦治疗慢性前列腺炎以湿热瘀浊阻滞下焦为主要病机，运用主病主方思想，以当归贝母苦参丸、复元活血汤为主方加减，对该病进行分期论治。\\n',\n",
       " 'SN 1005-5304\\n',\n",
       " 'CN 11-3519/R\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 季卫东;\\n',\n",
       " 'AD 上海交通大学;上海交通大学中国法与社会研究院;上海交通大学人工智能治理与法律研究中心;\\n',\n",
       " 'T1 计算法学的疆域\\n',\n",
       " 'JF 社会科学辑刊\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 03\\n',\n",
       " 'OP 113-126+2\\n',\n",
       " 'K1 逻辑法学;司法统计;法律专家系统;大数据挖掘;网络分析;人工智能治理;元算法\\n',\n",
       " ' \\n',\n",
       " '\\n',\n",
       " 'AB 要在宏大的时空架构里定位计算法学,就必须根据史实梳理法学为了限制权力任意性而尝试的各种机制设计。在这里,可以发现两条基本思路:一条是法教义学的推理与概念计算,另一条是科学技术指向的实验与制度演算。在第二种思路的延长线上,不妨以现代化过程中出现的\"法律数学\"构想为背景和线索,对计算法学在信息与通信技术时代应运而生的契机和发展阶段进行进一步分析,可以发现其中存在的五个主要维度:(1)基于统计和预测模型的计量法律学;(2)法律推理电脑化和专家系统算法;(3)法律信息学的大数据挖掘与机器学习;(4)对法律网络结构的图谱和矩阵演算;(5)包括数据伦理和算法公正在内的人工智能治理等不同组成部分之间交叉和相辅相成的关系。最后这一维度反映了计算法学的超越性,也揭示了深入研究关于价值排序和价值函数的元算法的重要意义。\\n',\n",
       " 'SN 1001-6198\\n',\n",
       " 'CN 21-1012/C\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 左平熙;\\n',\n",
       " 'AD 北京大学信息管理系;\\n',\n",
       " 'T1 大数据时代高校图书馆智慧服务的逻辑与路径\\n',\n",
       " 'JF 图书馆工作与研究\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 05\\n',\n",
       " 'OP 48-54\\n',\n",
       " 'K1 大数据时代;高校图书馆;智慧服务\\n',\n",
       " ' Dig data era;University library;Intelligent service\\n',\n",
       " '\\n',\n",
       " 'AB 本文梳理大数据环境下高校图书馆智慧服务研究现状,构建了由物质层面、服务层面以及技术层面构成的高校图书馆智慧服务逻辑总体架构,特别研究了高校图书馆智慧服务模式的推进路径,即提出基于Hadoop的高校图书馆大数据挖掘技术支撑体系,为高校图书馆智慧服务提供有力支撑;以智慧检索、智慧挖掘与智慧知识推荐为技术突破点,提升高校图书馆智慧服务的个性化程度;完善包括高校图书馆智慧学科服务、智慧互动服务、智慧移动服务、智慧特殊群体服务以及评价反馈功能的高校图书馆智慧服务机制,重视高校图书馆业务部门的改革重组和智慧馆员的培养等。\\n',\n",
       " 'SN 1005-6610\\n',\n",
       " 'CN 12-1020/G2\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 陆康;刘慧;曹畋;\\n',\n",
       " 'AD 南京晓庄学院;\\n',\n",
       " 'T1 大数据技术视域下智慧图书馆伦理危机与控制研究\\n',\n",
       " 'JF 高校图书馆工作\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 03\\n',\n",
       " 'vo 41\\n',\n",
       " 'OP 46-50\\n',\n",
       " 'K1 智慧图书馆;用户隐私;伦理危机;数据安全\\n',\n",
       " ' Smart library;User privacy;Ethical crisis;Data security\\n',\n",
       " '\\n',\n",
       " 'AB 互联网技术创新的迅猛发展与智慧图书馆的数据技术创新给用户带来的变化不仅引起文献资源服务方式的变化,而且用户思维观念与学习方式也发生了改变。技术改变传统服务模式引发的伦理问题层出不穷。国内外学者从多角度对大数据技术引起的伦理问题的现象、机理和治理等方面进行探索。从梳理智慧图书馆的相关文献可以发现,现有研究普遍存在着重技术、轻制度的现象,因此需要进一步深入智慧图书馆制度与伦理方面的研究,以正确认识、破解大数据技术给智慧图书馆所带来的伦理风险,从而规范图书馆技术创新行为,避免伦理问题导致智慧图书馆业务的非可控性。\\n',\n",
       " 'SN 1003-7845\\n',\n",
       " 'CN 43-1032/G2\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 郝少东;杨闪闪;刘彩萍;李月廷;\\n',\n",
       " 'AD 北京中医药大学;北京市中西医结合医院外科;\\n',\n",
       " 'T1 基于数据挖掘的中药专利复方治疗慢性胆囊炎的用药规律分析\\n',\n",
       " 'JF 中国现代应用药学\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 09\\n',\n",
       " 'vo 38\\n',\n",
       " 'OP 1069-1073\\n',\n",
       " 'K1 慢性胆囊炎;古今医案云平台;关联规则;聚类分析;核心网络\\n',\n",
       " ' chronic cholecystitis;ancient and modern medical case cloud platform;association rules;cluster analysis;core network\\n',\n",
       " '\\n',\n",
       " 'AB 目的探讨中药专利复方治疗慢性胆囊炎的用药规律。方法使用中国专利数据库检索治疗慢性胆囊炎的中药处方,建立Excel数据表对处方进行筛选处理,应用古今医案云平台软件对数据进行分析。结果筛选治疗慢性胆囊炎的复方170个,用药以寒性、苦味为主,归经以肝经为主。使用频次前10位的中药分别为柴胡、甘草、郁金、金钱草、茵陈、白芍、大黄、川楝子、黄芩、延胡索;关联规则显示药物以白芍-柴胡、白芍-甘草、黄芩-柴胡、大黄-金钱草、川楝子-柴胡、川楝子-郁金、川楝子-金钱草配伍较多;聚类分析得到7类药物组合;复杂网络分析得到30味核心中药和3组核心药物网络配伍。结论治疗慢性胆囊炎的中药专利复方药物性味以苦寒为主,多归肝经,用药以疏肝利胆、清热利湿、理气活血、泻下通腑类药物为主,配伍以疏肝柔肝、缓急止痛、和解表里、清热利湿、疏肝利胆为主,治疗上常用四逆散、金铃子散、大柴胡汤、茵陈蒿汤等方进行加减。\\n',\n",
       " 'SN 1007-7693\\n',\n",
       " 'CN 33-1210/R\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 李瑶;付浩;李文林;杨丽丽;曾莉;冯昊天;\\n',\n",
       " 'AD 南京中医药大学针灸推拿养生康复学院;南京中医药大学人工智能与信息技术学院;江苏省中医外用药开发与应用工程研究中心;南京中医药大学第一临床医学院;内蒙古乳业技术研究院有限责任公司;\\n',\n",
       " 'T1 面部色素性疾病中药面膜专利处方分析及作用机制探讨\\n',\n",
       " 'JF 中国皮肤性病学杂志\\n',\n",
       " 'OP 1-8\\n',\n",
       " 'K1 中药面膜;专利;面部色素性疾病;数据挖掘;网络药理学\\n',\n",
       " ' Traditional Chinese medicine mask;Patent;Facial pigmented diseases;Data mining;Network pharmacology\\n',\n",
       " '\\n',\n",
       " 'AB 目的 采用数据挖掘及网络药理学方法分析面部色素性疾病的中药面膜专利处方的成分作用机制及有效靶点。方法 利用国家知识产权局的专利公布公告平台收集中药面膜治疗面部色素性疾病的专利处方，对符合标准的专利信息进行收集纳入至Microsoft Excel 2016，统计并利用MicrosoftWord 2016绘制了近20年中药面膜专利数量变化折线图，运用R语言对纳入中药进行频次和关联规则分析，将频数前20味的药物进行系统聚类，获得其中的核心药物，于中药系统药理学分析平台数据库(TCMSP)对其进行成分、靶点筛选，将所得靶点输入UniProt数据库中查询对应的基因名称，结果与疾病数据库GeneCards、OMIM、DisGeNET、DrugBank中筛选得到的疾病靶点进行匹配，获取核心药组治疗面部色素性疾病的关键靶点；利用在线网站DrawVennDiagram将疾病与药物之间的共同靶点用Venn图呈现；采用STRING平台、DAVID数据库对关键靶点进行蛋白互作网络(PPI)及富集分析；在微生信平台上绘制GO和KEGG通路富集分析图。最后通过Cytoscape3.8.0构建中药-成分-关键靶点-通路网络。结果 共检索纳入符合标准的中药面膜专利433条，分析出核心药物6味（白及、白术、白芷、茯苓、当归、珍珠），这些药物已探明的有效成分有β-谷固醇、豆甾醇、常春藤皂苷元、茯苓酸等共66个，关联的疾病靶点1475个，疾病与核心药组的共同靶点23个，涉及癌症信号通路、肿瘤坏死因子信号通路、细胞凋亡等相关通路30条。潜在核心靶点主要有PTGS2、PIK3CG、PTPN1、PTGS1、3CASP3、NR3C2、TDP1等。结论 用于面部色素性疾病的中药面膜专利的处方以白芷、茯苓、白芨、珍珠、当归为主，核心药物与古代用于美容养颜的外用处方“七子白”的组合类似，提示面部色素性疾病的中药应用可多考虑补益药与其他药物的配伍，这类处方以三萜类和香豆素类化合物为主要有效成分，以HSP90AA1、PTPN1、EGFR、CASP3等为重要靶点，通过癌症信号通路、细胞凋亡、p53等通路发挥抗炎、抑制酪氨酸酶活性，减少黑色素生成的作用。其规律可为以专利面膜类信息为基础，为后续的临床实验研究提供思路与参考，以针对性开发对面部色素性疾病有治疗作用的外用新药。\\n',\n",
       " 'SN 1001-7089\\n',\n",
       " 'CN 61-1197/R\\n',\n",
       " 'LA 中文\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 王亮;\\n',\n",
       " 'AD 南开大学现代远程教育学院;\\n',\n",
       " 'T1 学习者与平台交互行为挖掘及学习预测模型构建\\n',\n",
       " 'JF 中国远程教育\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 05\\n',\n",
       " 'OP 62-67\\n',\n",
       " 'K1 学习分析技术;机器学习模型;数据挖掘;时间序列;预测分析;决策树;交互行为;学习环境\\n',\n",
       " ' \\n',\n",
       " '\\n',\n",
       " 'AB 学习分析技术是一种通过对学习者在学习中的实际参与、表现和进展以及自身属性等各种相关数据的分析对其学习结果进行预测的技术。通过模型分析可以为学习者提供预测结果,并实时向教学管理者、课程设计者和任课教师等提供相应的干预策略,以避免学习者可能最终学习失败的结果。随着大规模在线课程的迅猛发展,需要针对性的预测模型来支持学习者的在线学习过程。本文提出了一种以学习者与平台教学资源间的交互行为为基础构建适应大规模在线学习预测模型的新方法。与传统学习分析方法不同,该模型不需要对学习者前期学习情况有过多了解,也无须教学设计者或领域专家的过多参与,在通用环境的课程结构以及随时间变化的前提下具有良好的预测准确性。\\n',\n",
       " 'SN 1009-458X\\n',\n",
       " 'CN 11-4089/G4\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 李晓理;卜坤;翟玉鹏;王康;\\n',\n",
       " 'AD 北京工业大学信息学部;计算智能与智能系统北京市重点实验室;数字社区教育部工程研究中心;\\n',\n",
       " 'T1 基于人工智能技术的重大活动食品安全与风险评估综述\\n',\n",
       " 'JF 北京工业大学学报\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 05\\n',\n",
       " 'vo 47\\n',\n",
       " 'OP 530-539\\n',\n",
       " 'K1 人工智能;大型活动;安全监管;食品安全;犯罪预防;风险评估\\n',\n",
       " ' artificial intelligence(AI);high profile events;safety supervision;food safety;crime prevention;risk assessment\\n',\n",
       " '\\n',\n",
       " 'AB 随着中国国际地位的提高,举办大型活动日渐频繁.大型活动人员规模大、政治规格高、被社会大众广为关注等特点决定了其食品安全保障与传统食品监管有着不同的侧重点.为了更好地让人工智能技术服务于重大活动食品安全保障,从多个角度进行分析.首先,简要回顾传统食品安全监管行业的发展历史;其次,对现有的食品安全保障技术进行概括与总结,包含计算机视觉、物联网等人工智能技术;最后,根据重大活动的特点,基于现有犯罪预防与风险评估技术的应用现状,分析讨论重大活动食品安全风险评估技术的发展前景与困难.\\n',\n",
       " 'SN 0254-0037\\n',\n",
       " 'CN 11-2286/T\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " 'RT Journal Article\\n',\n",
       " 'SR 1\\n',\n",
       " 'A1 马钰锡;张全新;谭毓安;沈蒙;\\n',\n",
       " 'AD 北京理工大学计算机学院;北京理工大学网络空间安全学院;鹏城实验室网络空间安全研究中心;\\n',\n",
       " 'T1 面向智能攻击的行为预测研究\\n',\n",
       " 'JF 软件学报\\n',\n",
       " 'YR 2021\\n',\n",
       " 'IS 05\\n',\n",
       " 'vo 32\\n',\n",
       " 'OP 1526-1546\\n',\n",
       " 'K1 攻击预测;行为预测;智能攻击;攻击行为;人工智能\\n',\n",
       " ' attack prediction;behavior prediction;intelligent attack;attack behavior;artificial intelligence\\n',\n",
       " '\\n',\n",
       " 'AB 人工智能的迅速发展和广泛应用促进了数字技术的整体跃升.然而,基于人工智能技术的智能攻击也逐渐成为一种新型的攻击手段,传统的攻击防护方式已经不能满足安全防护的实际需求.通过预测攻击行为的未来步骤,提前部署针对性的防御措施,可以在智能攻击的对抗中取得先机和优势,有效保护系统安全.首先界定了智能攻击和行为预测的问题域,对相关研究领域进行了概述;然后梳理了面向智能攻击的行为预测的研究方法,对相关工作进行分类和详细介绍;之后,分别阐述了不同种类的预测方法的原理机制,并从特征及适应范围等角度对各个种类的方法做进一步对比和分析;最后,展望了智能攻击行为预测的挑战和未来研究方向.\\n',\n",
       " 'SN 1000-9825\\n',\n",
       " 'CN 11-2560/TP\\n',\n",
       " 'LA 中文;\\n',\n",
       " 'DS CNKI\\n',\n",
       " '\\n',\n",
       " '\\n',\n",
       " '\\n']"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "with open('CNKI-20210617085020804.txt', encoding='utf-8') as f:\n",
    "    display(f.readlines())"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.8.3"
  },
  "toc": {
   "base_numbering": 1,
   "nav_menu": {},
   "number_sections": true,
   "sideBar": true,
   "skip_h1_title": false,
   "title_cell": "Table of Contents",
   "title_sidebar": "Contents",
   "toc_cell": false,
   "toc_position": {},
   "toc_section_display": true,
   "toc_window_display": false
  },
  "varInspector": {
   "cols": {
    "lenName": 16,
    "lenType": 16,
    "lenVar": 40
   },
   "kernels_config": {
    "python": {
     "delete_cmd_postfix": "",
     "delete_cmd_prefix": "del ",
     "library": "var_list.py",
     "varRefreshCmd": "print(var_dic_list())"
    },
    "r": {
     "delete_cmd_postfix": ") ",
     "delete_cmd_prefix": "rm(",
     "library": "var_list.r",
     "varRefreshCmd": "cat(var_dic_list()) "
    }
   },
   "types_to_exclude": [
    "module",
    "function",
    "builtin_function_or_method",
    "instance",
    "_Feature"
   ],
   "window_display": false
  }
 },
 "nbformat": 4,
 "nbformat_minor": 4
}
